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本 系列 从 书 共 分 2 卷 ,本 书 为 第 1 卷 ,是 一 本 以 情景 方式 对 Android 的 源 代码 进行 深入 分 析 的 书 , 内 容 
广泛 ,主要 从 Dalvik 虚拟 机 整体 结构 、 获 取 和 编译 Dalvik 虚拟 机 的 源码 、 源 码 分 析 辅 助 工具 使 用 、. dex 文 
件 及 Dalvik 字 节 码 格 式 解 析 、Dalvik 虚拟 机 下 的 系统 工具 介绍 及 Dalvik 虚拟 机 执行 流程 简 述 等 方面 进行 
阐述 ,帮助 读者 从 宏观 上 了 和 解 Dalvik 虚拟 机 的 架构 设计 ,为 有 兴趣 阅读 Dalvik 虚拟 机 源码 的 读者 提供 必要 
的 入 门 指导 。 

第 1 卷 共 6 章 : 第 1 章 为 准备 工作 ,在 这 一 章 中 主要 介绍 了 Dalvik 虚拟 机 的 功用 、 分 析 Dalvik 源码 所 
用 到 的 主要 方法 以 及 如 何 搭 建 Dalvik 源码 分 析 环 境 ;第 2 章 为 源码 分 析 辅 助 工具 介绍 ,包括 Vim、 
Doxygen、GDBSERVER 等 ;第 3 章 为 Dex 文件 以 及 Dalvik 字 节 码 格式 分 析 ;第 4 章 为 系统 工具 介绍 ,在 这 
一 章 中 主要 介绍 了 Dalvik 虚拟 机 的 一 些 重要 系统 工具 ,通过 对 系统 工具 的 介绍 ,让 读者 对 虚拟 机 内 部 的 实 
现 机 制 更 加 清晰 ;第 5 章 为 Dalvik 虚拟 机 执行 流程 简 述 ,通过 这 一 章 的 介绍 , 旨 在 让 读者 对 Dalvik 虚拟 机 
的 整体 功能 架构 有 一 个 宏观 的 认识 ,为 后 续 进 一 步 掌握 各 个 功能 模块 的 原理 功能 做 好 相应 的 知识 铺垫 ;第 
6 章 为 调试 支撑 模块 ,在 这 一 章 中 主要 介绍 了 调试 支撑 模块 的 基本 原理 。 

通过 阅读 本 书 , 让 读者 了 解 Dalvik 虚拟 机 在 Android 应 用 程序 运行 过 程 中 所 扮演 的 重要 角色 及 其 不 
可 替代 的 价值 ;同时 对 Android 应 用 程序 的 执行 过 程 有 更 加 细致 的 了 解 ,可 以 帮助 读者 优化 自己 编写 的 应 
用 程序 ,更 加 合理 地 设计 应 用 程序 结构 ,有 效 提高 应 用 程序 的 运行 速度 。 
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随 着 移动 互联 网 的 不 断 发 展 , 业 务 移动 化 已 逐渐 被 人 们 接受 ,移动 电子 商务 、 移 动 办 公 、 
移动 生活 越发 深入 人 心 。 作 为 目前 市 场 占 有 率 最 高 的 Android 操作 系统 ,当之无愧 受到 广 
大 程序 开发 人 员 的 青睐 。Android 是 由 Google 公司 基于 移动 设备 而 开发 的 嵌入 式 系统 , 具 
有 优良 的 性 能 表现 以 及 较 低 的 硬件 配置 需求 ,因此 使 其 迅速 成 为 目前 移动 终端 之 上 的 主流 
操作 系统 。 这 种 优势 的 体现 主要 得 益 于 Google 对 作为 Android 系统 基石 的 Dalvik 虚拟 机 
所 做 出 的 大 量 优 化 。 对 于 高 阶 程序 开发 人 员 来 说 ,要 想 让 自己 开发 的 应 用 程序 在 数 十 万 应 
用 程序 中 脱颖而出 ,就 必须 掌握 整个 Android 系统 运行 时 环境 ,这 其 中 最 为 关键 的 就 是 
Dalvik 虚拟 机 。 

本 书 详细 地 介绍 了 Dalvik 虚拟 机 的 结构 及 其 运行 机 制 ,尤其 针对 类 数据 加 载 , 内 存 管 
理 \ 本 地 方法 \ 反 射 机 制 . 解 释 器 、 即 时 编译 等 关键 功能 模块 的 设计 原理 、 功 能 架构 以 及 执行 
流程 进行 了 介绍 ,并 结合 关键 代码 加 以 细致 讲解 。 力 求 让 读者 了 解 Dalvik 虚拟 机 是 如 何在 
底层 对 Android 应 用 程序 进行 解释 执行 ,并 可 以 结合 Dalvik 虚拟 机 技术 特性 对 自己 的 应 用 
程序 加 以 优化 改进 ,以 达到 进一步 提高 应 用 程序 安全 性 、 稳 定性 、 高 效 性 的 目的 。 

全 书 共 分 为 6 音 : 

第 1 章 为 准备 工作 ,主要 介绍 Dalvik 虚拟 机 的 定义 以 及 它 的 功用 ,分 析 Dalvik 源码 所 
用 到 的 主要 方法 以 及 如 何 搭建 Dalvik 源码 分 析 环 境 。 

第 2 章 为 源码 分 析 辅 助 工具 介绍 ,主要 介绍 一 些 辅助 源码 分 析 的 工具 ,包括 Vim、 
Doxygen、GDBSERVER ,并 介绍 了 其 使 用 的 方法 ,为 后 期 的 阅读 和 分 析 打下 基础 。 

第 3 章 为 Dex 文件 以 及 Dalvik 字 节 码 格式 分 析 ,主要 介绍 Dex 文件 中 所 涉及 的 各 个 数 
据 结构 以 及 相关 函数 的 具体 定义 ,并 结合 一 个 Dex 文件 实例 对 原理 内 容 进行 讲解 。 同 时 还 
对 Dalvik 字 节 码 进 行 了 全 面 的 介绍 ,主要 包括 字 节 码 设计 、 字 节 码 格式 等 内 容 。 另 外 ,在 这 
章 的 最 后 还 对 Dex 文件 的 优化 产物 Odex 文件 功能 原理 与 实际 应 用 进行 了 简单 的 介绍 ,为 
后 续 进 一 步 深 入 讨论 Dex 文件 的 优化 机 制 做 好 相关 准备 。 

第 4 章 为 系统 工具 介绍 ,主要 介绍 Dalvik 虚拟 机 的 一 些 重要 系统 工具 ,这 些 工 具 主 要 
应 用 于 Dex 文件 优化 ,封装 的 apk 文件 进行 或 对 Dex 进行 反 编译 ,调试 分 析 Android 程序 
源码 内 存 泄漏 问题 ,分 析 Android 程序 运行 过 程 中 生成 的 trace 文件 等 。 通 过 对 系统 工具 的 
介绍 ,让 读者 更 清楚 虚拟 机 内 部 的 实现 机 制 。 

第 5 章 为 Dalvik 虚拟 机 执行 流程 简 述 ,主要 介绍 Dalvik 虚拟 机 的 整体 执行 流程 以 及 各 
个 模块 所 扮演 的 功能 角色 。 通 过 这 一 章 的 介绍 , 旨 在 让 读者 对 Dalvik 虚拟 机 的 整体 功能 架 
构 有 一 个 宏观 的 认识 ,为 后 续 进一步 掌握 各 个 功能 模块 的 原理 功能 做 好 相应 的 知识 铺垫 。 

第 6 章 为 调试 支撑 模块 ,主要 介绍 调试 支撑 模块 的 基本 原理 ,随后 ,着 重 介 绍 DDM 协 
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议 JDWP 协议 .Debugger 调试 器 三 者 的 原理 及 实现 ,以 帮助 读者 更 加 清晰 地 理解 调试 支撑 
这 部 分 内 容 。 

本 书 主要 由 哈尔滨 工程 大 学 张 国 印 . 吴 艳 霞 编写 ,参与 本 书 编写 和 校 核 工作 的 还 有 汪 永 峰 、 
王 彦 璋 , 谢 东 良 . 于 成 , 张 婷 婷 、. 许 圣明 、 苗 施 亮 ,. 檀 凯 ,这 里 对 他 们 的 辛苦 工作 表示 衷心 的 
感谢 。 

本 书 主 要 是 针对 高 级 Android 应 用 开发 工程 师 、Android 系统 开发 工程 师 、Android 移 
植 工程 师 及 对 Android Dalvik 虚拟 机 源码 实现 感 兴趣 的 读者 。 
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第 工 曹 
准备 工作 


本 章 主要 内 容 

如 你 知道 Dalvik 虚拟 机 吗 ? 

局 开发 者 有 必要 了 解 Dalvik 虚拟 机 吗 ? 
名 如 何 分 析 Dalvik 虚拟 机 源码 ? 

司 如 何 搭建 源码 分 析 环 境 ? 


随 着 移动 互联 网 的 不 断 发 展 ,业务 移动 化 已 逐渐 被 人 们 接受 ,移动 电子 商务 移动 办 公 、 
移动 生活 越发 深入 人 心 。 智 能 手机 间 的 竞争 已 从 硬件 的 竞争 中 逐渐 走出 ,取而代之 的 是 操 
作 系 统 的 竞争 。 作 为 目前 市 场 占有 率 最 高 的 Android 操作 系统 ,受到 广大 程序 开发 人 员 的 
青睐 。 对 于 程序 开发 人 员 来 说 ,如 果 能 使 自己 开发 的 应 用 程序 在 数 十 万 应 用 程序 中 脱 颖 而 
出 ,无 疑 是 对 自身 能 力 最 好 的 肯定 。 要 想 达 到 这 种 水 平 ,必须 深入 理解 应 用 开发 的 各 个 细 
节 , 不 仅 包括 用 户 体验 ,还 包括 代码 的 质量 和 性 能 。 想 要 提高 Android 应 用 程序 的 执行 效 
率 ,就 一 定 要 深入 理解 Android 应 用 程序 是 如 何 执 行 的 ,并 且 对 于 整个 Android 系统 运行 时 
环境 的 学 习 也 是 十 分 必要 的 ,这 就 不 得 不 提 到 Dalvik 虚拟 机 。 


1.1 本 章 概述 


当 你 翻 开 这 本 书 时 ,想必 一 定 多 次 见 到 过 如 图 1. 1 所 示 的 Android 系统 架构 图 ,在 
Android 运行 时 环境 部 分 (Android Runtime) 可 以 找到 接 下 来 将 要 介绍 的 Dalvik 虚拟 机 
(Dalvik Virtual Machine) 。 


1.1.1 什么 是 Dalvik 虚拟 机 


Dalvik 虚拟 机 是 Google 等 厂商 合作 开发 的 Android 移动 设备 平台 的 核心 组 成 部 分 之 
一 。Dalvik 由 Dan Bornstein 编写 ,名 字 来 源 于 他 的 祖先 曾经 居住 过 的 名 叫 Dalvik 的 小 渔 
村 ,村 子 位 于 冰岛 。 

很 多 人 认为 Dalvik 虚拟 机 就 是 一 个 Java 虚拟 机 ,因为 Android 的 编程 语言 恰恰 就 是 
Java 语言 。 但 是 这 种 说 法 并 不 准确 ,因为 Dalvik 虚拟 机 并 不 是 按照 Java 虚拟 机 的 规范 来 
实现 的 ,两 者 并 不 兼容 ,对 于 这 一 点 后 面 还 会 介绍 。 

那么 到 底 什么 是 Dalvik 虚拟 机 呢 ? 首先 , 它 是 一 个 虚拟 机 ,也 就 是 一 个 虚构 出 来 的 计 
算 机 ,是 通过 在 实际 的 计算 机 上 仿真 模拟 各 种 计算 机 功能 来 实现 的 。 它 有 自己 完善 的 硬件 
架构 ,如 处 理 器 \ 堆 栈 、 寄 存 器 等 ,还 具有 相应 的 指令 系统 。 第 二 ,这 台 虚 拟 出 来 的 计算 机 主 
要 负责 运行 Android 应 用 程序 , 它 是 Android 应 用 程序 中 Java 代码 的 运行 基础 。 其 指令 集 
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图 1.1 Android 系统 架构 图 


基于 寄存 器 架构 ,执行 其 特有 的 文件 格式 一 一 Dex 字 节 码 来 完成 对 象 生命 周期 管理 ,堆栈 管 
理 、 线 程 管理 .安全 异常 管理 .垃圾 回收 等 重要 功能 。 它 的 核心 内 容 是 实现 库 (libdvm. so)， 
大 体 由 C 语言 实现 。 依 赖 于 Linux 内 核 的 一 部 分 功能 一 一 线程 机 制 . 内 存 管理 机 制 、 能 高 
效 使 用 内 存 以 及 在 低速 CPU 上 表现 出 的 高 性 能 。 每 一 个 Android 应 用 在 底层 都 会 对 应 一 
个 独立 的 Dalvik 虚拟 机 实例 ,其 代码 在 虚拟 机 的 解释 下 得 以 执行 。 

Android 系统 架构 可 以 分 为 4 层 ,分 别 是 应 用 程序 层 、 应 用 程序 框架 层 (Framework)， 
核心 库 层 与 Dalvik VM 以 及 Linux 内 核 。Dalvik VM 和 核心 库 在 同一 层级 ,作为 承上启下 
的 重要 一 环 。 所 有 Android 应 用 程序 都 运行 在 Dalvik VM 之 上 ,如 果 Android 应 用 程序 需 
要 调用 核心 库 中 的 库 函 数 ,Dalvik VM 将 调用 本 地 接口 (Native Interface) 并 执行 核心 库 中 
的 函数 。 在 Dalvik VM 之 上 运行 的 程序 或 应 用 是 跨 平台 的 ,但 Dalvik VM 是 和 操作 系统 及 
硬件 相关 的 。 其 依赖 操作 系统 掌管 的 一 些 功能 ,如 线程 调度 ,内存 管理 等 。 和 操作 系统 与 底 
层 硬 件 相关 一 样 ,Dalvik VM 的 解释 器 和 JIT 都 因 硬 件 的 不 同 而 有 不 同 的 实现 ,如 ARM 系 
列 .MIPS 以 及 Intel X86 等 平台 都 对 应 有 不 同 的 实现 。 

作为 Android 平台 至 关 重 要 的 中 间 件 ,Dalvik VM 的 输入 是 经 过 dx 工具 打包 好 的 Dex 
文件 ,输出 是 程序 执行 结果 。 图 1. 2 以 Hello. java 为 例 , 给 出 了 一 个 普通 应 用 程序 在 Dalvi 
虚拟 机 中 的 执行 流程 。 

Google 推荐 Android 应 用 程序 使 用 的 编程 语言 是 Java。 如 果 编 写 性 能 要 求 高 的 程序 ， 
可 使 用 C/C++ 。Dalvik VM 在 API 上 和 Oracle 公司 的 Java API 是 兼容 的 ,减少 了 应 
序 开发 难度 。 编 写 好 的 Java 程序 可 以 直接 用 PC 上 的 Java 编译 器 编译 为 class 文件 。 


磺 区 
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图 1.2 Dalvik VM 执行 应 用 程序 流程 图 


之 后 ,需要 使 用 Dalvik VM 提供 的 dx 工具 对 其 进行 转换 。Dalvik VM 最 初 是 基于 
ARM 这 个 RISC 架构 设计 的 ,和 传统 的 基于 栈 的 Java 虚拟 机 不 同 ,其 是 基于 寄存 器 的 。 基 
于 寄存 器 的 虚拟 机 相 比 于 基于 栈 的 虚拟 机 ,有 更 少 的 losd/store 之 类 的 访 存 类 指令 ,也 就 是 
更 少 的 内 存 访问 和 指令 分 派 次 数 。 根 据 统计 , 相 比 于 JVM ,在 Dalvik VM 上 运行 的 应 用 程 
序 要 少 47% 的 指令 数 。dx 工具 解析 class 文件 ,合并 多 个 class 文件 ,转换 为 基于 寄存 器 的 
字 节 码 , 并 优化 字 节 码 ,最 终生 成 Dex 文件 。 生 成 的 Dex 文件 将 作为 Dalvik VM 的 输入 。 

Dalvik VM 启动 并 初始 化 后 ,Dex 文件 将 被 映射 到 内 存 区 ,解释 器 开始 将 Dex 文件 中 
的 每 一 条 字 节 码 解 释 为 本 地 代码 并 运行 。 如 图 1. 2 所 示 ,解释 器 的 工作 流程 和 真实 CPU 的 
工作 原理 非常 相像 ,都 包括 取 指 、 解 码 以 及 执行 。 具 体 的 实现 原理 较为 简单 ,以 一 个 循环 来 
完成 一 条 字 节 码 的 解释 工作 。Dalvik 解释 器 从 内 存 中 取得 字 节 码 , 并 对 字 节 码 进行 解码 
(获取 字 节 码 号 ) ,之 后 跳 转 到 对 应 的 代码 段 执行 。 无 论 是 C 语言 编写 的 解释 器 还 是 汇编 语 
言 编写 的 解释 器 ,每 一 条 字 节 码 都 有 一 段 与 之 等 价 的 最 终 执行 。 如 果 有 JIT 的 支持 ,JIT 将 
编译 热 代码 ,并 将 编译 后 的 Native Code 安装 至 内 存 区 。 再 次 执行 时 ,解释 器 将 跳 转 至 相应 
Native Code 执行 ,这 将 大 幅度 提高 执行 速度 。 

点 拨 Dalvik 虚拟 机 的 设计 者 Dan Bornstein 的 个 人 主页 是 http://www. milk. com/ 
home/danfuzz/。Dalvik 虚拟 机 源码 目录 下 的 docs 目录 中 也 有 对 虚拟 机 进行 相关 介绍 的 文 
档 ,可 予以 参考 。 


1.1.2 Dalvik 虚拟 机 的 功能 


1.1.1 节 中 已 经 简要 介绍 了 Dalvik 虚拟 机 的 功能 ,概括 来 说 ,Dalvik 虚拟 机 主要 完成 对 
象 生 命 周期 的 管理 ,堆栈 的 管理 、 线 程 管理 ` 安 全 和 异常 的 管理 以 及 垃圾 回收 等 重要 功能 。 
在 Dalvik 设计 的 过 程 中 充分 利用 了 Linux 进程 管理 的 特点 ,使 其 可 以 同时 运行 多 个 进程 ， 
这 就 使 得 在 Android 系统 上 可 以 同时 运行 多 个 应 用 程序 ,每 一 个 应 用 程序 都 对 应 后 台 一 个 
独立 的 虚拟 机 进程 。 

Dalvik 虚拟 机 考虑 到 运行 环境 资源 相对 紧张 的 特点 ,对 线程 管理 .类 加 载 . 内 存 管理 、 


a 


Android Dalvik 康 拟 机 结构 及 机 制 剖 析 一 一 第 1 卷 。”Dalvik 虚拟 机 结构 剖析 


本 地 接口 .反射 机 制 、 解 释 器 .即时 编译 等 主要 功能 模块 做 了 相应 的 优化 及 创新 。 具 体 功 能 
如 下 。 

进程 管理 : 进程 隔离 和 线程 管理 ,每 一 个 Android 应 用 在 底层 都 会 对 应 一 个 独立 的 
Dalvik 虚拟 机 实例 ,所 有 的 Android 应 用 的 线程 都 对 应 一 个 Linux 线程 ,进程 管理 依赖 于 
Zygote 机 制 实现 。 

Zygote 线程 管理 : 每 一 个 Android 应 用 都 运行 在 一 个 Dalvik 虚拟 机 实例 里 ,而 每 一 个 
虚拟 机 实例 都 是 一 个 独立 的 进程 空间 ,这 样 做 的 优点 是 最 大 程度 地 保护 了 应 用 的 安全 和 独 
立 运行 。Zygote 进程 是 在 系统 启动 时 产生 的 , 它 会 完成 虚拟 机 的 初始 化 . 库 的 加 载 、 预 置 类 
库 的 加 载 和 初始 化 等 操作 ,而 在 系统 需要 一 个 新 的 虚拟 机 实例 时 ,Zygote 通过 复制 自身 ,最 
快速 地 提供 一 个 虚拟 机 实例 。 另 外 ,对 于 一 些 只 读 的 系统 库 , 所 有 虚拟 机 实例 都 和 Zygote 
共享 一 块 内 存 区 域 , 极 大 地 节省 了 内 存 开销 。Zygote 是 虚拟 机 实例 的 孵化 器 。 它 通过 init 
进程 来 启动 ,首先 会 用 化 出 System_Server 启动 系统 服务 ,并 且 监 听 Socket 等 待 请 求 命令 ， 
当 有 一 个 应 用 程序 启动 时 ,Zygote 会 调用 相应 函数 fork 出 一 个 新 的 进程 来 执行 应 用 程序 。 
Zygote 进行 fork 时 有 以 下 三 种 不 同 的 方式 。 

(1) fork() ,fork 一 个 普通 的 进程 ,该 进程 属于 Zygote 进程 。 

(2) forkAndSpecialize() ,fork 一 个 特殊 的 进程 ,该 进程 不 再 是 Zygote 进程 。 

(3) forkSystemServer() ,fork 一 个 系统 服务 进程 。 

类 加 载 : 解析 Dex 文件 并 加 载 Dalvik 字 节 码 。 

对 Android 源码 经 过 Android SDK 编译 后 生成 的 APK 文件 进行 一 系列 的 处 理 , 再 在 
展开 的 APK 文件 中 找到 classes. dex 文件 并 从 Dex 文件 中 加 载 Dalvik 字 节 码 供 虚拟 机 执 
行 模块 调用 。 

类 加 载 器 在 虚拟 机 中 负责 查找 并 加 载 字 节 码 文件 , 即 通过 提取 二 进 制 的 字 节 码 文件 ,并 
将 其 存 入 该 类 的 运行 时 数据 结构 , 供 解释 器 执行 。 在 加 载 目 标 类 时 ,还 需要 将 该 类 的 所 有 超 
类 和 超 类 实现 的 接口 ,需要 加 载 的 类 分 为 基础 类 库 和 用 户 自 定义 类 。 当 虚拟 机 装载 某 个 类 
型 时 ,类 加 载 器 会 定位 相应 的 字 节 码 文件 ,然后 读 入 这 个 字 节 码 文件 ,提取 其 中 的 数据 信息 ， 
并 将 这 些 信 息 存 储 到 对 应 的 内 存 中 。 

Android 系统 启动 时 ,类 加 载 器 会 加 载 所 有 基础 类 库 ,用户 自 定义 类 是 在 虚拟 机 运行 时 
才 载 入 的。 当 虚 拟 机 在 运行 时 需要 调用 的 一 个 成 员 方法 或 者 一 个 成 员 变量 所 属 的 类 没有 被 
解析 的 时 候 , 虚 拟 机 会 调用 类 加 载 模 块 ,对 这 个 类 、 超 类 以 及 这 些 类 的 相关 接口 进行 加 载 和 

内 存 管理 : 分 配 系 统 启 动 初始 化 和 应 用 程序 运行 时 需要 的 内 存 资源 。 

Dalvik 虚拟 机 内 存 管理 分 为 内 存 分 配 和 垃圾 回收 。 内 存 分 配 的 底层 依赖 是 基于 Doug 
Lea 编写 的 dlmalloc 内 存 分 配器 ,在 Heap 上 完成 ,按照 分 配 规则 ,每 分 配 一 个 内 存 区 域 经 
过 数 次 尝试 。 如 果 分 配 不 成 功 ,就 启动 垃圾 收集 按照 相应 策略 进行 垃圾 收集 。Dalvik 虚拟 
机 在 垃圾 回收 时 使 用 Mark Sweep 算法 .该 算法 一 般 分 为 Mark 阶段 和 Sweep 阶段 。Mark 
阶段 就 是 标记 出 活动 对 象 ,使 用 栈 来 保存 根 集合 ,然后 对 栈 中 的 每 一 个 元 素 , 递 归 追 踪 所 有 
可 访问 的 对 象 ,对 于 所 有 可 访问 的 对 象 ,在 markBits 位 图 中 该 将 对 象 的 内 存 起 始 地 址 对 应 
的 位 设 为 1。 这 样 当 栈 为 空 时 ,markBits 位 图 就 是 所 有 可 访问 的 对 象 集合 。 垃 圾 收集 的 第 
二 步 就 是 回收 内 存在 Mark 阶段 通过 markBits 位 图 可 以 得 到 所 有 可 访问 的 对 象 集合 ,而 
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liveBits 位 图 表示 所 有 已 经 分 配 的 对 象 集合 。 因 此 通过 比较 这 两 个 位 图 ,liveBits 位 图 和 
markBits 位 图 的 差异 就 是 所 有 可 回收 的 对 象 集合 。 

本 地 接口 : 让 既 有 代码 继续 发 挥 作 用 。 在 Java 代码 中 调用 其 他 代码 的 接口 。 

JNI 是 Java Native Interface 的 缩写 , 即 Java 本 地 调用 。 从 Java 1. 1 开始 ,Java Native 
Interface(JND) 标 准 成 为 Java 平台 的 一 部 分 , 它 允 许 Java 代码 和 其 他 语言 写 的 代码 进行 交 
互 。JNI 一 开始 是 为 了 本 地 已 编译 语言 ,尤其 是 C 和 C++ 而 设计 的 ,但 是 它 并 不 妨碍 使 用 
其 他 语言 ,只 要 调用 约定 受 支持 就 可 以 了 。Android 系统 的 Dalvik 虚拟 机 实现 了 这 套 接口 ， 
供 Dalvik 虚拟 机 的 Java 应 用 与 本 地 代码 实现 互相 调用 。 

注重 处 理 速 度 : 和 本 地 代码 (C/C++ 等) 相 比 ,Java 代码 的 执行 速度 相对 慢 一 些 。 如 果 
对 某 段 程序 的 执行 速度 有 较 高 的 要 求 ,建议 使 用 C/C++ 编写 代码 。 而 后 在 Java 中 通过 JNI 
调用 基于 C/C++ 编写 的 部 分 ,常常 能 够 获得 更 快 的 运行 速度 。 例 如 ,图 形 处 理 等 需要 大 量 
计算 的 情况 下 通常 会 采用 该 机 制 。 

直接 进行 硬件 控制 : 为 了 更 好 地 控制 硬件 ,硬件 控制 代码 通常 使 用 C 语言 编写 。 而 后 
借助 JNI 将 其 与 Java 层 连 接 起 来 ,从 而 实现 对 硬件 的 控制 。Dalvik 虚拟 机 使 用 一 些 本 地 代 
码 编写 的 已 编译 的 代码 库 与 硬件 .操作 系统 直接 进行 交互 。 

对 既 有 本 地 代码 的 复 用 : 在 程序 编写 过 程 中 ,常常 会 使 用 一 些 已 经 编写 好 的 本 地 代码 
(如 CVC++ 代码 ), 既 提高 了 编程 效率 ,又 确保 了 程序 的 安全 性 与 健壮 性 。 在 复 用 这 些 本 地 
代码 时 ,就 要 通过 JNI 本 地 调用 接口 来 实现 。 

从 整体 来 看 ,使 用 JNI 主要 在 于 可 以 直接 重用 一 些 数量 庞大 的 本 地 代码 ,对 于 那些 性 能 
要 求 比较 高 的 代码 而 言 ,通过 JNI 机 制 使 用 本 地 代码 可 以 增强 程序 的 性 能 ,减少 功 耗 ,特别 
是 对 于 内 存 较 小 .CPU 运算 速度 有 限 和 电池 电量 不 够 充沛 的 嵌入 式 移动 手机 设备 而 言 , 提 
高 性 能 减少 功 耗 这 一 点 就 显得 尤为 重要 。 然 而 ,使 用 JNI 调用 接口 也 会 带 来 一 些 负面 影响 ， 
比如 有 些 时 候 失 去 了 平台 的 可 移植 性 ,但 是 从 综合 角度 考虑 ,在 有 些 情 况 下 ,JNI 机 制 带 来 
的 优点 要 大 于 它 的 缺点 。 

反射 机 制 : 能 动态 查看 .调用 ,更 改 任意 类 中 的 方法 和 属性 ,并 能 根据 自身 行为 的 状态 
和 结果 ,调整 或 修改 应 用 所 描述 行为 的 状态 和 相关 的 语义 。 

反射 机 制 是 Dalvik 虚拟 机 中 的 核心 机 制 之 一 ,也 算 作 一 类 工具 ,合理 地 使 用 反射 机 制 
能 使 Java 代码 变 得 更 加 简洁 、 灵 活 。 同 时 ,反射 机 制 是 Java 被 当 作 准 动态 语言 的 一 个 关键 
性 质 。 反射 机 制 允 许 程序 在 运行 的 过 程 中 通过 反射 机 制 的 API 取得 任何 一 个 已 知名 称 的 
类 的 内 部 信息 ,包括 其 中 的 描述 符 、 超 类 ,也 包括 属性 和 方法 等 所 有 信息 ,并 且 可 以 在 程序 运 
行 时 改变 属性 的 相关 内 容 或 调用 其 内 部 的 方法 。 反 射 机 制 在 实现 其 功能 时 首先 通过 上 层 应 
用 API 运 用 JNI 本 地 调用 机 制 调 用 本 地 方法 集中 的 函数 ,再 向 下 层 调用 Dalvik 虚拟 机 中 的 
内 部 函数 ,最 后 将 结果 逐 层 返回 到 最 上 层 的 应 用 。 

解释 器 : 根据 自身 的 指令 集 Dalvik ByteCode 解释 字 节 码 。 

解释 器 是 Dalvik 虚拟 机 的 执行 引擎, 它 负 责 解释 执行 Dex 字 节 码 。 在 Android 4. 04 
版 本 的 虚拟 机 中 ,解释 器 共有 两 种 实现 ,分 别 是 C 语言 实现 和 汇编 语言 的 实现 ,分 别称 作 可 
移植 型 (Portable) 解 释 器 和 快速 型 (Fast) 解 释 器 。 在 字 节 码 加 载 已 经 完毕 后 ,Dalvik 虚拟 机 
解释 器 开始 取 指 解释 字 节 码 。 解 释 器 根据 指令 进行 相应 的 操作 ,然后 返回 相应 的 结果 。 

在 mterp 目录 下 有 一 个 重要 的 部 分 , 即 out 目录 ,存储 的 是 针对 各 个 平台 的 解释 器 程序 
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和 CC 语言 实现 的 通用 解释 器 。 在 解释 器 执行 时 ,仿照 真实 机 器 执行 ,分 别 有 取 指 、 执 行 过 
程 。 在 每 个 操作 码 的 解释 程序 完成 后 ,就 取 下 一 条 指令 ,并 跳 转 执行 ,以 提高 效率 。 解 释 器 
的 入 口 代码 位 于 interp 目录 下 的 Interp. cpp 中 的 dvmInterpret 函数 ,在 该 函数 中 ,根据 系 
统 参数 的 不 同 ,会 分 别 选择 Fast 解释 器 和 Portable 解释 器 来 执行 dvmMterpStd 和 
dvmInterpretPortable。 

执行 引擎 是 虚拟 机 的 核心 ,负责 执行 字 节 码 或 者 本 地 方法 。Dalvik 虚拟 机 主要 采用 解 
释 执行 的 方式 ,Android 4. 04 版 本 的 虚拟 机 同时 支持 JIT 编译 器 技术 。 

解释 执行 方式 是 指 虚拟 机 在 执行 过 程 中 将 每 一 条 字 节 码 指令 解释 成 本 地 代码 运行 ,其 
工作 原理 比较 简单 , 字 节 码 的 解释 过 程 是 一 个 循环 结构 ,每 次 循环 完成 一 条 字 节 码 的 执行 工 
作 : 取 指 令 、 执 行 功 能 和 跳 转 。 简 言 之 ,解释 执行 方式 就 是 把 字 节 码 指令 的 功能 用 特定 平台 
上 的 语言 来 实现 。 解 释 执行 是 利用 该 平台 的 资源 ,不 需要 进行 附加 的 硬件 设计 ,利用 软件 来 
实现 虚拟 机 的 方式 。 

即时 编译 : 将 反复 执行 的 热 代 码 编译 成 本 地 码 ,降低 解释 器 压力 。 

JIT 技术 是 将 字 节 码 编译 成 本 地 代码 执行 , 当 某 一 个 方法 第 一 次 被 调用 时 ,JIT 编译 器 
将 对 虚拟 机 方法 表 所 指向 的 字 节 码 进 行 编译 ,编译 后 表 中 的 指针 将 指向 编译 生成 的 机 器 码 ， 
如 果 程 序 再 次 执行 该 方法 时 ,将 执行 经 过 编译 的 代码 ,提高 了 执行 速度 。 

众所周知 ,程序 执行 有 两 种 方式 ,分 别 为 解释 和 编译 。 解 释 方式 是 在 逐 句 读 取 源 程序 逐 
句 翻译 成 机 器 码 再 执行 ;而 编译 方式 则 是 在 运行 程序 前 ,整个 翻译 为 等 价 的 目标 程序 ,计算 
机 直接 执行 该 目标 程序 。JIT(Just-In-Time) ,中 文 含义 为 即时 编译 ,又 称 为 动态 编译 ,执行 
时 动态 地 编译 程序 ,以 缓解 解释 器 的 低 效 工 作 。JIT 混合 了 两 种 技术 ,解释 器 解释 时 ,编译 
部 分 程序 ,并 在 下 次 直接 执行 该 编译 后 的 源 程序 。 

对 于 Java 这 类 语言 来 说 ,不 论 是 解释 器 还 是 JIT 模块 ,都 是 在 中 间 代 码 基础 上 做 文章 。 
Java 语言 编译 后 ,生成 和 平台 无 关 的 中 间 代 码 。 不 同 平台 上 的 虚拟 机 (JVMD) 都 可 以 执行 相 
同 的 Java 中 间 代 码 ,同时 需要 处 理 和 操作 系统 和 硬件 平台 相关 的 部 分 。 这 也 是 大 多 数 解释 
型 语言 采用 的 模型 。 虚 拟 机 中 最 主要 的 是 解释 器 ,负责 解释 执行 中 间 代码 。 

虽 有 跨 平台 的 优势 ,但 同时 也 带 来 了 运行 效率 低 的 直观 感受 。 究 其 原因 ,是 因为 其 
执行 原理 是 一 句 一 句 翻 译 字 节 码 。 比 如 , 字 节 码 中 出 现 循环 ,根据 解释 器 的 原理 , 它 需 要 
重复 地 解释 并 执行 这 一 组 程序 。 这 使 得 纯粹 基于 解释 器 运行 的 程序 效率 十 分 低下 ,造成 
了 浪费 。 

JIT 是 解决 这 个 缺陷 的 一 种 有 效 手段 。 通 过 将 字 节 码 编 译 为 Native Code, 让 解释 器 不 
再 重复 执行 这 些 热 点 代码 片段 。 而 且 , 相 比 于 解释 器 .JIT 编译 器 可 以 更 高 效 地 利用 CPU 
和 寄存 器 。 同 时 在 编译 的 过 程 中 ,可 以 进行 部 分 低级 代码 优化 ,比如 常数 传播 ,取消 范围 检 
查 、 复 制 传播 等 。 尽 可 能 地 生成 媲美 编译 器 编译 的 二 进 制 代码 。 之 后 执行 编译 生成 的 
Native Code, 从 而 达到 加 速 执行 应 用 程序 的 目的 。 


1.1.3 Dalvik 虚拟 机 与 Java 虚拟 机 的 区 别 


Dalvik 虚拟 机 并 不 是 按照 Java 虚拟 机 的 规范 来 实现 的 ,二 者 并 不 兼容 ;二 者 的 最 大 差 
异 是 架构 上 的 差异 , 即 Dalvik 虚拟 机 的 设计 是 基于 寄存 器 的 ,Java 虚拟 机 的 设计 是 基于 
栈 的 。 
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那 为 何 Java 虚拟 机 选择 基于 栈 的 设计 ,而 Dalvik 虚拟 机 选择 基于 寄存 器 的 设计 呢 ? 这 
和 Dalvik 运行 的 硬件 环境 有 关 。 众 所 周知 ,Dalvik 运行 于 手持 设备 之 上 ,手持 设备 大 多 采 
用 的 是 ARM 或 是 相似 的 RISC 结构 的 CPU, 这 些 硬 件 有 个 特点 ,相对 来 说 ,RISC 架构 有 更 
丰富 的 寄存 器 。 如 果 Dalvik 的 字 节 码 也 采用 RISC 架构 设计 ,在 中 间 语 言 这 一 层 , 就 有 丰富 
的 寄存 器 。 这 就 使 得 在 解释 时 ,避免 了 过 多 的 访 存 指令 。 

Dalvik 虚拟 机 和 Java 虚拟 机 另外 一 个 显著 的 区 别 是 两 个 虚拟 机 上 运行 的 文件 格式 不 
同 ,前 者 具有 自己 专 有 的 文件 格式 (. dex) ,后 者 则 是 字 节 码 文 件 (. class)。 在 Java 程序 中 ， 
Java 类 会 被 编译 成 一 个 或 多 个 字 节 码 文件 ,然后 打包 为 . jar 文件 ,Java 虚拟 机 从 相应 的 
.class 和 .jar 文件 中 获取 相应 的 字 节 码 。Android 应 用 程序 也 是 用 Java 语言 编写 的 ,但 在 
编译 成 . class 文件 后 ,还 会 通过 dx 工具 将 所 有 . class 文件 统一 封装 成 一 个 . dex 文件 ， 
Dalvik 虚拟 机 从 中 读 取 指 令 和 数据 。 

点 拨 掌握 Dalvik 虚拟 机 与 Java 虚拟 机 的 联系 和 区 别 对 于 学 习 Dalvik 虚拟 机 是 非常 
有 帮助 的 ,目前 除 源码 目录 中 的 一 小 部 分 技术 文档 外 ,官方 并 没有 给 出 关于 Dalvik 虚拟 机 
的 技术 文档 , 建议 在 学 习 Dalvik 虚拟 机 前 类 比 Java 虚拟 机 来 学 习 , 相 信 可 以 达到 事半功倍 
的 效果 。 其 官方 (The Java@ Virtual Machine specification) 的 网 址 为 http://docs. oracle. 


com/javase/specs/jvms/se7/html/index. html。 


1.1.4 Dalvik 虚拟 机 的 特性 


Dalvik 虚拟 机 非常 适合 在 移动 终端 上 使 用 ,相对 于 在 桌面 系统 和 服务 器 系统 运行 的 虚 
拟 机 而 言 , 它 不 需要 很 快 的 CPU 速度 和 大 量 的 内 存 空 间 。 根 据 Google 的 测算 ,64MB 的 
RAM 已 经 能 够 令 系统 正常 运转 了 。 其 中 24MB 被 用 于 底层 系统 的 初始 化 和 启动 ,另外 
20MB 被 用 于 启动 高 层 服 务 。 当 然 , 随 着 系统 服务 的 增多 和 应 用 功能 的 扩展 ,其 所 消耗 的 内 
存 也 势必 越 来 越 大 。 

Android 是 由 Google 公司 基于 移动 设备 而 开发 的 嵌入 式 系统 ,具有 优良 的 性 能 表现 以 
及 较 低 的 硬件 配置 需求 ,因此 使 其 迅速 成 为 目前 移动 终端 之 上 的 主流 操作 系统 。 这 种 优势 
的 体现 主要 得 益 于 Google 对 作为 Android 系统 基石 的 Dalvik 虚拟 机 所 做 出 的 大 量 优化 。 
实际 上 ,Dalvik 虚拟 机 并 不 是 一 个 标准 的 Java 虚拟 机 ,因为 它 不 符合 Java 虚拟 机 设计 规 
范 。Dalvik 虚拟 机 是 一 个 针对 嵌入 式 系统 中 低速 CPU 和 内 存 受 限 等 特点 ,经 过 专门 设计 
优化 而 实现 的 Java 语言 虚拟 机 。 

Dalvik 虚拟 机 是 基于 寄存 器 架构 的 , 相 比 基于 堆栈 的 标准 Java 虚拟 机 ,基于 寄存 器 设 
计 的 Dalvik 虚拟 机 的 操作 指令 更 长 ,因此 用 于 实现 相同 程序 的 指令 数 则 更 少 , 同 时 对 于 较 
大 的 程序 ,其 花费 的 编译 时 间 也 更 少 。 研 究 表明 ,寄存 器 架构 虚拟 机 比 起 堆栈 虚拟 机 ,相同 
功能 程序 字 节 码 减 少 了 47% ;代码 总 量 增加 25% ;内 存 访问 次 数 减少 37. 42% ;程序 整体 执 
行 时 间 减 少 32. 30% 。Dalvik 虚拟 机 使 用 专用 的 ByteCode 字 节 码 ,在 Android 2.1 中 ,共有 
218 个 字 节 码 ,分 布 在 Ox00 与 Oxff 之 间 , 中 间 保 留 了 38 个 无 效 字 节 码 。 字 节 码 的 存储 方 
式 为 16 位 比特 的 无 符号 数 。 同 时 ,为 了 能 在 资源 受 限 的 谋 入 式 系统 中 实现 更 高 的 性 能 ， 
Dalvik 虚拟 机 使 用 专门 定制 的 Dex 文件 作为 可 执行 文件 。Dex 文件 是 对 多 个 Class 文件 进 
行 高 效 整合 的 产物 ,使 各 个 类 共享 相同 的 数据 ,减少 了 元 余 性 ,结构 十 分 紧凑 。 
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1.2 Ubuntu Linux 系统 安装 


在 系统 安装 前 ,需要 获取 一 个 版 本 为 Ubuntu 10. 04 的 系统 镜像 ,该 镜像 大 小 为 
695MB, 目 前 网 络 上 的 资源 很 多 且 下 载 速 度 较 快 ,读者 自行 下 载 即 可 。 在 获取 了 安装 程序 
之 后 ,需要 根据 需求 选择 安装 方式 。 

安装 方式 主要 分 为 两 种 : 

O 在 本 机 上 直接 安装 Ubuntu 系统 ; 

@ 在 虚拟 机 中 安装 Ubuntu 系统 。 

两 种 方式 各 有 利弊 ,简单 来 说 ,在 本 机 上 直接 安装 会 较 少 地 占用 系统 资源 ,系统 的 工作 
效率 较 高 ,适合 机 器 配置 较 低 的 用 户 , 但 对 于 不 常用 Linux 系统 的 用 户 来 说 可 能 会 有 较 多 的 
不 便 ; 在 虚拟 机 中 安装 相对 来 说 更 加 安全 且 简 便 , 尤 其 对 于 长 期 使 用 Windows 的 用 户 来 说 ， 
不 会 干扰 其 习惯 的 工作 模式 ,但 在 虚拟 机 中 运行 Ubuntu 系统 对 机 器 的 性 能 要 求 较 高 ,建议 
机 器 配置 较 高 的 用 户 选 择 这 种 安装 方式 。 

点 拨 Ubuntu 10. 04 的 硬件 门槛 很 低 ,但 为 了 保证 学 习 的 顺利 ,建议 读者 参照 如 下 标 
准 配置 设备 。 四 处 理 器 : 尽量 选用 Inter 工 系列 64 位 多 核 处 理 器 ,或 者 其 他 支持 64 位 虚拟 
化 技术 的 处 理 器 。 回 内 存 : 4GB 以 上 。 硬盘 : 至 少 60GB。 轩 图 形 性 能 不 做 要 求 。 

下 面 通过 图 示 简 单 介绍 一 下 系统 的 安装 流程 。 

(1) 将 烧 录 好 的 系统 盘 插 入 计算 机 ,并 启动 计算 机 ,正确 读 取 系 统 盘 后 会 出 现 如 图 1. 3 
所 示 的 界面 。 


图 1.3 系统 启动 


这 里 需要 指出 ,选择 直接 安装 的 用 户 可 以 将 系统 镜像 烧 录 到 DVD 光盘 或 是 UD 盘 中 ,以 
制 成 系统 启动 盘 。 关 于 启动 盘 的 制作 方法 ,网 上 有 大 量 的 资料 ,在 此 就 不 再 袭 述 ;选择 虚拟 
机 安装 的 用 户 可 以 直接 加 载 系统 镜像 ,其 后 安装 步骤 和 直接 安装 完全 相同 。 

(2) 经 过 一 段 时 间 的 等 待 , 就 正式 开始 系统 的 安装 了 。 首 先 , 需 要 对 系统 语言 .键盘 布 
局 以 及 时 区 等 基本 信息 进行 设 定 , 如 图 1. 4 所 万 

(3) 完成 相关 的 设 定之 后 ,将 要 为 目标 系统 选择 相应 的 安装 位 置 ,可 以 直接 选择 将 系统 
安装 到 一 块 硬盘 中 ,也 可 以 通过 分 区 工具 对 目标 硬盘 进行 分 区 ,并 将 系统 装 入 指定 分 区 中 ， 
如 图 1.5 所 示 。 
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图 1.4 语言 .键盘 及 时 区 设置 
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图 1.5 系统 分 区 设置 


(4) 在 这 个 界面 中 ,需要 对 用 户 名 .计算机 名 以 及 密码 等 信息 进行 设 定 。 值 得 注意 的 
是 ,密码 一 定 要 认真 记录 ,在 Linux 操作 系统 中 经 常 需要 输入 密码 以 获取 操作 权限 ,如 图 1. 6 
所 示 。 

(5) 在 完成 用 户 名 、 密 码 等 信息 设 定之 后 ,系统 将 开始 自动 安装 ,如 图 1.7 所 示 。 

(6) 系统 安装 结束 后 会 提示 将 重新 启动 ,在 启动 完毕 后 正确 输入 之 前 设 定 的 用 户 名 以 
及 密码 则 可 以 登录 到 系统 ,如 图 1. 8 所 示 。 

至 此 ,Ubuntu 系统 的 安装 就 简要 介绍 完毕 。 这 也 完成 了 Android 源码 调试 分 析 的 第 
一 步 工作 。 
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Dalvik 
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选择 一 个 密码 来 确保 你 的 账户 安全 . 
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图 1.6 创建 账户 


，。 感谢 您 选用 Ubuntu 10.04 LTS. 


”这 一 发 行 版 对 Ubuntu 项 目 有 着 里 程 碑 式 的 意义 。 数 以 百 计 的 改进 使 它 比 以 往 的 版 本 更 易 用 、 更 可 靠 。 这 些 改进 包括 
新 的 砚 舌 编辑 实 、 集 成 的 社交 网 络 功能 和 数量 仍 在 不 断 增 长 的 内 加 软件 集 等 。 


* 我 们 相信 ， 无 论 您 是 第 一 次 党 试 Ubuntu 的 新 用 户 ， 还 是 既 验 丰 富 的 长 期 用 户 ， 如 会 发 现 您 所 豆 欢 的 东西 。 在 安装 进 
行 时 ， 我 们 地 请 您 通过 这 相 幻 打 片 一 起 来 探索 ! 


Ubuntu 设计 的 宗 轩 


图 1.7 系统 安装 


© 


dalvik-desktop 


Dalvik 


图 1.8 系统 登录 


1.3 工作 目录 设置 


工作 位 置 的 选择 有 一 定 的 自主 性 ,可 以 依据 个 人 习惯 设置 相应 的 工作 目录 ,在 本 书 中 作 
者 将 源码 的 存储 位 置 设置 为 主 文件 夹 下 的 Android 4. 0.4 文件 夹 中 。 实 际 上 创建 一 个 空 的 
文件 的 方式 有 很 多 ,但 在 本 书 中 一 律 使 用 “终端 ?进行 操作 ,因此 读者 有 必要 在 闲暇 时 了 解 
Linux 系统 命令 的 使 用 。 

首先 ,开启 一 个 终端 ,操作 如 图 1. 9 所 示 。 


外 加 种 图 7 月 18 日 皇 戎 四 上午 8:33 @ dalvik 由 


图 1.9 开启 终端 


开启 终端 后 , 即 可 输入 相关 的 Linux 命令 并 回 车 以 完成 相应 的 操作 ,如 图 1. 10 所 示 。 


媒 应 用 程序 位 置 系统 如 窗 种 加 7 月 18 昌 星期 四 上 午 836 @ dalvik 由 
单 二 查看 和 
CY Y WT 
文件 (F) 编 输 (E) 各 看 m ) 
datvikBdatvik-desktop:- 


图 1.10 创建 工作 目录 
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本 部 分 实际 上 只 需要 一 条 命令 , 即 mkdir Android 4. 0.4, 用 于 在 主 目录 下 创建 一 个 名 
为 Android 4. 0. 4 的 空 文件 夹 ,该 文件 夹 是 用 来 存储 Android 系统 源码 ,也 是 工作 的 主要 位 
加之 二 


1.4 下 载 .编译 和 运行 Android 内 核 源 代码 


1.4.1 下 载 Android 内 核 源 代码 


完成 了 工作 目录 的 设 定 后 ,就 可 以 开始 准备 下 载 源码 了 。 本 书 将 对 下 载 源码 过 程 中 的 
每 一 步 操 作 进行 介绍 ,力求 帮助 读者 理解 这 些 操作 的 真正 意义 ,而 不 是 单纯 地 输入 指令 并 
执行 。 

第 1 步 安装 Git 

Git 是 用 于 Linux 内 核 开发 的 版 本 控制 工具 。 与 CVS、Subversion 一 类 的 集中 式 版 本 
控制 工具 不 同 , 它 采用 了 分 布 式 版 本 库 的 作法 ,不 需要 服务 器 端 软件 ,就 可 以 运作 版 本 控制 ， 
使 得 源 代码 的 发 布 和 交流 极其 方便 。 简 单 来 说 ,在 本 书 中 Git 就 是 用 来 管理 下 载 Android 
系统 源码 的 。 

输入 命令 : sudo apt-get install git-core, 并 回 车 。 随 后 系统 会 要 求 输入 用 户 密 码 以 取得 
安装 权限 ,在 正确 输入 密码 后 系统 将 自动 安装 目标 程序 ,如 图 1. 11 所 示 。 


dalvik@dalvik-laptop:~$ sudo apt-get install git-core 
[sudo] password for datvik: 了 


图 1.11 输入 安装 命令 及 系统 密码 
系统 将 提示 是 否 继续 ,输入 YY 后 继续 安装 ,如 图 1. 12 所 示 。 


正在 读 取 软 件 包 列表 ... 完成 
正在 分 析 软 件 包 的 依赖 关系 树 
正在 读 取 状态 信息 ... 完成 
片 会 安装 下 列 椒 外 的 软件 包 : 
libdigest-shal-perl liberror-perl patch 
建议 安装 的 软件 包 : 
git-doc git-arch git-cvs git-svn git-email git-daemon-run git-gui gitk 
gitweb diffutils-doc 
下 列 【 新 】 软 件 包 将 被 安装 : 
git-core libdigest-shal-perl liberror-perl patch 
升级 了 9 个 软件 包 ， 新 安装 了 4 个 软件 包 ， 要 和 卸载 9 个 软件 包 ， 有 317 个 软件 包 未 被 升 
豚 。 
需要 下 载 5,811KB 的 软件 包 。 
穷 压缩 后 会 消耗 掉 12.1MB 的 额外 空间 。 
您 希望 继续 执行 四 ? [Y/n] 烟 


图 1.12 提示 是 否 继续 安装 


值得 注意 的 是 ,在 安装 过 程 中 需要 保持 网 络 连接 正常 ,因为 系统 需要 对 目标 程序 的 安装 
文件 进行 下 载 。 

出 现 如 图 1. 13 所 示 的 信息 后 , 即 表示 安装 结束 。 

第 2 步 ”安装 curl 

curl 是 利用 URL 语法 在 命令 行 方 式 下 工作 的 文件 传输 工具 ,其 支持 多 种 网 络 协议 ,如 
FTP,FTPS, HTTP, HTTPS, GOPHER,TELNET, DICT, FILE 以 及 LDAP 等 。 简单 来 


第 1 章 准备 工作 


获取 : 1 http://cn.archive.ubuntu.com/ubuntu/ Lucid/main liberror-perl 9.17-1 [23 
.8kB] 


获取 : 2 http://cn.archive.ubuntu.com/ubuntu/ Lucid/main libdigest-shal-perl 2.12 
-lbuitdl [26.2kB] 

获取 : 3 http://cn.archive.ubuntu.com/ubuntu/ lucid-updates/main git-core 1:1.7.9 
.4-1lubuntu6.2 [5,638kB] 

获取 : 4 http://cn.archive.ubuntu.com/ubuntu/ Lucid/main patch 2.6-2ubuntul [123k 
B] 

下 载 5,811kB， 耗 时 23 秒 (246kB/s) 

选中 了 曾 被 取消 选择 的 软件 包 liberror-perl。 

(正在 读 取 数 据 库 ... 系统 当前 总 共 安装 有 125731 个 文件 和 目录 。) 

正在 解压 缩 liberror-perl (从 .../liberror-perl 8.17-1 all.deb) ... 

选中 了 兽 被 取消 选择 的 软件 包 libdigest-shal-perl。 

正在 解压 缩 libdigest-shal-perl (从 .../libdigest-shal-perl 2.12-1lbuildl i386.deb 


) ... 

选中 了 曾 被 取消 选择 的 软件 包 git-core。 

正在 解压 缩 git-core (从 .../git-core 1%3al.7.9.4-lubuntu9.2 i386.deb) ... 
选中 了 曾 被 取消 选择 的 软件 包 patch。 

正在 解压 缩 patch (从 .../patch 2.6-2ubuntul i386.deb) ... 

正在 处 理 用 于 man-db 的 触发 器 ... 
正在 设置 liberror-perl (8.17-1) ... 
正在 设置 libdigest-shal-perl (2.12-1build1) ... 
正在 设置 git-core (1:1.7.8.4-lubuntu9.2) ... 
正在 设置 patch (2.6-2ubuntu1) ... 


图 1.13 安装 过 程 截图 


说 ,通过 给 定 一 个 目标 资源 的 URL,curl 工具 将 该 URL 的 目标 资源 下 载 至 本 地 。 
输入 命令 : sudo apt-get install git-core curl, 并 回 车 。curl 的 安装 过 程 和 前 面 安装 Git 
的 过 程 类 似 , 需 要 保持 网 络 连接 ,参见 图 1. 14。 


正在 读 取 软 件 包 列表 ..， 完成 
正在 分 析 软件 包 的 依赖 关系 树 
正在 读 取 状 态 信息 ... 完成 
git-core 已 经 是 最 新 的 版 本 了 。 
下 列 【 新 】 软 件 包 将 被 安装 : 
curl 
升级 了 9 个 软件 包 ， 新 安装 了 1 个 软件 包 ， 要 卸载 9 个 软件 包 ， 有 317 个 软件 包 未 被 升级 。 
需要 下 载 299kB 的 软件 包 。 
解压 缩 后 会 消耗 掉 324kB 的 额外 空间 。 
获取 : 1 http://cn.archive.ubuntu.com/ubuntu/ lucid-updates/main curl 7.19.7-lubuntul.3 [299kB] 
下 载 289kB， 耗 时 1 秒 (115kB/s) 
选中 了 曾 被 取消 选择 的 软件 包 curl。 
(正在 读 取 数据 库 ... 系统 当前 总 共 安装 有 126266 个 文件 和 目录 。) 
正在 解压 缩 curl (从 .../curL_7.19.7-lubuntu1.3_i386.deb) ... 
正在 处 理 用 于 man-db 的 触发 器 ... 
正在 设置 curl (7.19.7-lubuntu1.3) ... 


图 1.14 安装 curl 工 具 


出 现 如 上 信息 , 即 表示 安装 结束 。 

第 3 步 ”获取 repo, 通 过 curl 下载 repo 文件 

repo 文件 实际 上 是 Google 的 开发 人 员 所 编写 的 一 个 Python 脚本 文件 ,其 作用 是 通过 
调用 Git 来 实现 下 载 、. 管 理 Android 项 目的 软件 仓库 。 因 此 ,需要 通过 curl 获取 该 repo 文 
件 ,其 方法 如 下 。 

输入 命令 :curl https://dl-ssl. google. com/dl/googlesource/git-repo/repo> ~/bin/ 
repo, 并 回 车 ,如 果 命 令 被 正确 执行 后 ,应 该 可 以 在 bin 文件 夹 下 找到 一 个 名 为 repo 的 文件 ， 
如 图 1.15 所 示 。 

注 : 如 果 系统 提示 找 不 到 bin 文件 夹 , 可 以 在 主 目录 下 创建 名 为 bin 的 文件 夹 , 然 后 再 
运行 该 命令 ,如 图 1.16 所 示 。 
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画 更 & "+ < 二 天 ^ 
tv * 国 国 王国 


图 1.15 repo 文件 下 载 至 bin 文件 夹 中 


加 
目 
六 
鱼 


11 项 ， 剩 余 空间 : 20.9 GB 


图 1.16 在 根 目录 下 创建 bin 文件 来 


第 4 步 ”修改 执行 权限 ,取得 修改 repo 文件 的 权限 
刚刚 下 载 下 来 的 repo 文件 是 不 能 直接 使 用 的 ,需要 修改 其 中 一 些 参数 的 值 。 另 外 ,由 
于 repo 文件 可 能 是 一 个 只 读 文 件 , 因 此 通过 下 面 的 操作 获取 它 的 读 写 权限 。 
输入 命令 : chmod a 十 x 一 /bin/repo ,并 回 车 。 
第 5 步 修改 相关 的 环境 变量 
需要 将 bin 文件 和 路 径 添加 到 环境 变量 中 ,操作 如 下 。 
输入 命令 : gedit 一 /. bashrc, 如 图 1.17 所 示 。 
dalvik@dalvik-laptop:~$ gedit ~/.bashrc 
图 1.17 编辑 环境 变量 配置 文件 


随后 在 文件 的 最 后 添加 : export PATH 二 $PATH: 一 /bin 语句 并 回 车 ,如 图 1. 18 
所 示 。 
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## enable programmable completion features (you don't need to enable 
# this, if it's already enabled in /etc/bash.bashrc and /etc/profile 
## sources /etc/bash.bashrc). 
if [ -f /etc/bash completion ] && ! shopt -oq posix; then 

. /etc/bash_completion 
fi 
export PATH=$PATH:~/bin| 


图 1.18 增加 环境 变量 


第 6 步 设置 相关 的 下 载 信息 

首先 要 通过 使 用 cd 命令 进入 前 面 设 定 的 工作 目录 ,这 样 做 的 目的 是 表示 以 后 所 有 的 操 
作 都 在 该 目录 下 进行 ,这 是 Linux 系统 的 一 种 使 用 操作 逻辑 ,不 太 清 楚 其 中 道理 的 读者 ,可 
以 阅读 一 下 相关 的 资料 ,对 Linux 系统 操作 进行 学 习 ; 随 后 ,需要 设置 相应 的 下 载 信息 ,主要 
包括 目标 资源 的 URL 以 及 目标 的 Android 源码 版 本 ,在 本 书 中 所 用 到 的 版 本 为 android- 
4.0.4 2.1。 

输入 命令 : cd Android 4.0.4, 并 回 车 ,进入 目标 文件 夹 ,此 步骤 比较 关键 ,如 果 弄 错 了 
文件 夹 , 则 源码 也 将 被 下 载 至 错误 的 文件 夹 中 。 

输入 命令 : repo init -u https://android. googlesource. com/platform/manifest -b 
android-4. 0. 4_r2. 1, 并 回 车 ,完成 下 载 信息 的 设置 。 

第 7 步 下载 Android 源码 

完成 了 下 载 信 息 的 设 定 后 , 即 可 开始 下 载 指定 源码 ,其 操作 如 下 。 

输入 命令 : repo sync, 并 回 车 。 源 码 大 小 为 11GB, 其 下 载 时 间 较 长 ,需要 耐心 等 待 。 

注 : 如 果 下 载 中 中 断 , 重 新 执行 repo sync 命令 即 可 。 

通过 以 上 7 个 步骤 的 操作 并 且 系统 执行 无 误 的 情况 下 ,Android 4. 0.4 的 源码 将 被 完整 
地 下 载 至 本 机 。 至 此 ,可 以 准备 开始 对 源码 进行 编译 调试 的 工作 。 


1.4.2 整体 编译 Android 源 代码 


首先 需要 进入 源码 所 在 的 文件 目录 下 ,通过 使 用 cd 命令 即 可 。 在 读者 所 用 环境 下 输入 
命令 : cd Android 4. 0.4, 回 车 即 可 进入 该 目标 目录 。 

随后 需要 设置 相关 的 环境 变量 : 

输入 命令 : source build/envsetup. sh 并 回 车 ,应 当 出 现 如 图 1. 19 所 示 的 信息 。 


including device/moto/stingray/vendorsetup.sh 
including device/moto/wingray/vendorsetup.sh 
including device/samsung/crespo4g/vendorsetup.sh 
including device/samsung/crespo/vendorsetup.sh 
including device/samsung/maguro/vendorsetup.sh 
including device/samsung/torospr/vendorsetup.sh 
including device/samsung/toro/vendorsetup.sh 
including device/samsung/tuna/vendorsetup.sh 
inctuding device/ti/panda/vendorsetup.sh 
including sdk/bash_completion/adb.bash 


图 1.19 设置 环境 变量 图 


输入 命令 : lunch, 回 车 后 将 出 现 如 图 1. 20 所 示 的 信息 ,提示 选择 目标 编译 模式 。 

注 : 如 果 和 希望 在 本 机 上 以 Android 模拟 器 对 源码 进行 调试 , 则 应 当选 用 模式 : full-eng; 
如 希望 在 Samsung Galaxy Nexus 3 上 对 源码 进行 调试 . 则 应 当选 用 full_ maguro-userdebug 
模式 。 在 本 书 中 ,将 以 模式 full-eng 进行 介绍 。 
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输入 命令 : 1, 如 果 系 统 执 行 正确 将 会 出 现 如 which woutd you like? [futl-eng] 1 
图 1. 21 所 示 的 信息 。 


dalvik@dalvik- laptop: ~/workinq/androidsource/android4.8.4$ lunch 
You' re building on Linux 


Lunch meny... pick a combo: 

. full-eng 

. full x86-eng 

. vbox_x86-eng 

. full_stingray-userdebug 
. full wingray-userdebug 
. full_crespo4g-userdebug 
. full_crespo-userdebug 

. full_ maguro-userdebug 

. full torospr-userdebug 
19. full toro-userdebug 
11. full tuna-userdebug 
12. full panda-eng 


mwvowhwnNb 


Which would you like? [full-eng] 目 


图 1.20 目标 编译 模式 选择 图 


下 面 对 Android 整体 源码 进行 编译 ,还 是 在 当 DUEowVERSTON=6oDENAMEREL 
前 终端 中 输入 命令 : make -j4( 其 中 参数 j 表示 的 TANGET-BUI0D VARLANTzeng 


是 并 行 编译 ,而 4 表示 


TARGET_ BUILD TYPE=rel 
的 是 使 用 4 个 CPU 核心 对 Ee SS 


源码 进行 编译 ) 。 随 后 ,系统 将 自动 开始 对 全 部 的 “了 REETARCI WARAwr-aravy 


Android 源码 进行 编译 ,其 耗 时 较 长 需要 耐心 等 ”hosros 


HOST_AR 


=x86 
inux 


待 ,在 5 处 理 器 中 大 约 需要 3h 左右 ,在 虚拟 机 中 SEE retease 
大 约 需要 10h。 ee 


ee 成 后 ,系统 将 输出 如 图 1. 22 所 示 的 


Ls4.3 


host C++: Libdvm <= dalvik/vm/o0/Class.cpp 

target thumb C++: libdvm <= dalvik/vm/o0/Class.cpp 

target thumb C++: libdvm assert <= dalvik/vm/o0/Class.cpp 

target thumb C++: libdvm interp <= dalvik/vm/o0/Class.cpp 

target thumb C++: libdvm sv <= dalvik/vm/o0/Class.cpp 

host SharedLib: Libdvm (out/host/Linux-x86/obj/Lib/Libdvm.so) 

target SharedLib: libdvm interp (out/target/product/generic/obj/SHARED LIBRARIES 
/libdvm interp intermediates/LINKED/Libdvm_interp.so) 

target SharedLib: Libdvm {out/target/product/generic/obj/SHARED LIBRARIES/libdvm 
_intermediates/LINKED/libdvm. so) 

target SharedLib: libdvm assert (out/target/product/generic/obj/SHARED LIBRARIES 
/libdvm assert_intermediates/LINKED/libdvm assert.so) 

target SharedLib: libdvm sv (out/target/product/generic/obj/SHARED | LIBRARIES/lib 
dvm_sv_intermediates/LINKED/libdvm sv.so) 

target Symbolic: Libdvm (out/target/product/generic/symbols/system/lib/libdvm.so 


target Symbolic: libdvm interp (out/target/product/generic/symbols/system/lib/\i 
bdvm interp.so) 

target Strip: libdvm (out/target/product/generic/obj/lib/libdvm.so) 

target Symbolic: libdvm assert (out/target/product/generic/symbols/system/lib/li 
bdvm assert.so) 

target Strip: libdvm interp (out/target/product/generic/obj/\lib/libdvm interp.so| 


图 1.22 编译 输出 信息 


运行 Android 模拟 器 


可 以 通过 启动 模拟 器 来 检验 是 否 正 确 编译 了 全 部 的 Android 源码 。 


图 1.21 系统 执行 正确 提示 图 
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输入 命令 : emulator, 并 回 车 ,启动 模拟 器 。 经 过 一 段 时 间 的 等 待 ,如 模拟 器 成 功 启动 ， 
则 会 出 现 如 图 1. 23 所 示 的 界面 。 


OO 5554:<build> 


Te2D 


Wed November 14 
Charging. 50% 


图 1.23 模拟 器 界面 


该 模拟 器 和 人 们 常用 的 Android 手机 的 操作 模式 、 界 面 以 及 功能 都 是 一 样 的 ,但 不 支持 
和 触 屏 ,需要 用 鼠标 代替 手指 进行 操作 。 
至 此 ,完成 了 对 Android 源码 的 编译 工作 ,为 分 析 调试 Android 源码 做 好 了 准备 工作 。 


1.5 编译 经 过 修改 的 Android 源码 


经 过 对 源码 进行 分 析 研 究 ,读者 可 能 会 对 源码 进行 修改 ,以 达到 在 原 有 Android 系统 基 
础 上 增加 新 的 功能 ,提高 系统 执行 效率 等 目标 。 但 是 如 何 对 修改 后 的 源码 进行 编译 呢 ? 

事实 上 ,Android 提供 了 单独 对 个 别 模块 进行 编译 的 功能 , 即 通过 mmm 命令 可 以 实现 
对 指定 路 径 下 的 模块 进行 编译 ,例如 ， 端 中 输入 命令 : mmm dalvik/vm/, 即 可 对 Dalvik 
虚拟 机 中 的 VM 模块 进行 编译 ,但 需要 注意 的 是 该 指定 路 径 下 必须 包含 Android. mk 文件 ， 
否则 将 会 编译 出 错 。 根 据 作 者 在 实践 中 所 总 结 的 经 验 发 现 ,此 命令 的 实际 效果 不 是 太 好 ,时 
而 会 出 现 编译 失败 的 情况 。 

除了 mmm 命令 ,还 可 以 使 用 make 命令 ,因为 make 属于 一 种 增 量 编译 技术 , 即 只 对 修 
改过 的 源 代 码 进 行 编译 。 因 此 ,通过 make 命令 也 可 以 实现 对 那 部 分 经 过 修改 的 Android 
源码 进行 编译 。 更 重要 的 是 ,相对 mmm 命令 ,make 命令 更 加 稳定 、 出 错 率 低 , 作 者 推荐 使 


用 make 命令 。 


1.6 开发 第 一 个 Android 应 用 程序 


本 节 将 学 习 如 何 开发 一 个 Android 工程 .本 书 通过 一 个 简单 的 Android 实例 向 读者 介 
绍 这 一 具体 的 开发 流程 。 该 程序 实例 实现 的 主要 功能 是 在 屏幕 中 输出 “Welcome to 
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Android” 的 字符 串 ,该 程序 功能 虽然 简单 ,但 正 所 谓 麻 省 虽 小 、 五 脏 俱全 ,读者 可 以 从 中 学 
习 如 何 通过 Eclipse 编程 环境 创建 一 个 Android 工程 编写 Android 程序 代码 以 及 进行 程序 
的 调试 与 运行 等 基本 操作 。 


1. 新 建 一 个 Android 工程 


在 编写 代码 之 前 ,首先 需要 创建 一 个 Android 工程 ,和 普通 的 Java 程序 一 样 ,Android 
程序 的 开发 也 是 以 一 个 工程 包 的 形式 展现 的 。 因 此 ,有 过 Java 编程 经 验 的 读者 会 觉得 非常 
熟悉 ,而 唯一 不 同 的 是 : 相 较 于 标准 的 Java 应 用 开发 ,Google 为 Android 开发 者 提供 了 大 
量 全 新 的 API, 因 此 ,读者 应 该 对 这 些 API 进行 预览 式 的 学 习 , 以 提高 程序 的 开发 效率 。 
Android 工程 的 创建 流程 如 下 。 

步骤 1: 在 具备 Android 编程 环境 的 Eclipse 中 ,首先 单 击 File 菜单 ,随后 依次 选择 
New Project 菜单 命令 ,建立 一 个 新 工程 。 

步骤 2: 在 弹出 的 New Project 窗口 中 选择 Android Project 选项 ,然后 单 击 Next 按钮 ， 
新 建 一 个 Android 工程 ,如 图 1. 24 所 示 。 


Select a wizard pe 
Create an Android Application Project sa 


Wizards: 
ype flter text 


首 Android Project from Existing Code 
彤 Android Sample Project 
隘 Android Test Project 


b E Maven 
b BE Examples 


@ < Back Next > Finish [| Cancel | 


图 1.24 新 建 一 个 Android 工程 


步骤 3: 在 弹出 的 New Android Application 窗口 中 设置 新 建 的 Android 工程 相关 配置 
信息 ,包括 应 用 程序 名 称 、 工 程 名 称 以 及 包 名 称 等 ,如 图 1. 25 所 示 。 


2. 编写 具体 代码 


在 完成 了 Android 工程 的 创建 工作 后 , 便 可 以 开始 具体 的 代码 编写 工作 了 。 在 新 建 的 
工程 文件 中 ,选择 并 打开 Hello. java 文件 ,会 发 现 系统 已 经 自动 生成 了 部 分 代码 ,但 是 这 部 
分 代码 并 没有 实际 的 作用 ,更 不 会 达到 我 们 的 预期 目标 。 因 此 ,需要 对 这 部 分 代码 进行 改写 
扩充 ,将 想 要 实现 的 效果 所 对 应 的 代码 加 入 进去 。 修 改 后 的 代码 如 图 1. 26 所 示 。 

在 对 原 工 程 文件 完成 了 上 述 修 改 之 后 ,无 法 判断 程序 是 否 能 够 达到 预期 目标 ,因此 不 能 
将 其 直接 编译 并 生成 一 个 Android 软件 安装 程序 ,而 是 要 对 其 进行 一 系列 的 调试 运行 ,以 确 
保 程序 的 正确 性 。 
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New Android Application 
A The application name for most apps begins with an uppercase letter 


Application Name:s hello 
Project Name:® hello - 
Package Name:t| com.example.hello 


Minimum Required SDK:O API 3: Android 1.5 (Cupcake) 四 
Target SDK:6 API 15: Android 4.0.3 (IceCreamSandwich) v 

Compile With:0 |APL 15: Android 4.0.3 (IceCreamSandwich) v 

Themee| Holo Light with Dark Action Bar v 


2 Choose the lowest version of Android that your application will support Lower API levels target 
more devices, but means fewer features are available. By targeting API 8 and later you reach 
approximately 95% of the market. 


@ | <Back | Net> Einish Cancel 


图 1.25 配置 工程 信息 


[Package com. example. helloy 
import android.os.Bundle; 品 
public class MainActivity extends Rhccivicy { 


QOverride 

Protected void onCreate (Bundle savedInstanceState) { 
super.onCreate (saavedInstanceState); 
setContentView (R, layout ,activity main); 
TextView message = new TextView (this); 
message. setText ("Welcome to hndroid"); 
setContentView (message); 

》 


Qoverride 

Public boolean onCreateOptionsMenu (Menu menu) { 
// Inflate the menu; this adds items to the action bar if it is present. 
getMenuInflater () .inflate (R.menu.main, menu); 
return troe; 

} 


图 1.26 程序 代码 


3. 程序 调试 


Android 程序 的 调试 方法 和 普通 Java 程序 的 区 别 不 大 ,都 是 通过 设置 程序 执行 断 点 并 
结合 后 台 输 出 信息 对 当前 程序 的 执行 情况 进行 判断 ,看 是 否 能 达到 预期 目标 。 因 此 ,作者 也 
将 采用 这 种 调试 手段 对 该 实例 程序 进行 调试 并 介绍 。 

1) 断 点 设置 

在 Eclipse 编程 环境 中 ,设置 断 点 方法 非常 简单 : 只 需 双 击 目标 代码 行 的 左 侧 区 域 , 当 
目标 代码 行 左边 出 现 一 个 蓝 色 小 点 时 , 即 表示 完成 断 点 的 设置 ,如 图 1. 27 所 示 。 

点 拨 为 了 方便 查找 故障 代码 位 置 , 建 议 开 启 代 码 行 数 的 显示 功能 。 这 样 做 的 好 处 是 
在 调试 程序 的 过 程 中 ,可 以 根据 后 台 抛 出 的 异常 信息 快速 定位 到 故障 代码 段 , 以 达到 快速 修 
改 代 码 的 要 求 。 开 启 代码 行 数 显示 功能 的 具体 方法 是 : 在 代码 左 侧 的 空白 区 域 中 单 击 鼠 标 
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os Goverride 

1 Protected void onCreate (Bundle savedInstanceState) { 
12 super.onCreate (saavedInstanceState); 

hs setContentView (R.layout .activity main); 

14 TexrView message = new TextView(this); 

ss message.setText ("Welcome to Android"); 

16 setContentView (message); 

17 


图 1.27 断 点 设置 例 


右键 ,然后 在 弹出 的 菜单 中 选择 Show Line Numbers 选项 。 

2) 程序 调试 

想必 有 些 读者 一 定 使 用 过 Eclipse 编写 调试 Java 程序 ,但 就 调试 的 基本 方法 来 讲 ， 
Android 和 Java 几乎 没有 不 同 。 但 在 开始 调试 工作 之 前 ,仍然 需要 设置 相关 的 调试 属性 。 
在 左 侧 的 项 目 文件 列表 中 ,选中 项 目 名 并 单 击 右键 ,在 菜单 中 选择 Debug as Android 
Application 命令 , 即 表 示 当 前 是 对 一 个 Android 程序 进行 调试 ,如 图 1. 28 所 示 。 


Close Project 

Close Unrelated Projects Decluration Search BO Progress Console WY 
Assign Working Sets.. 

Fp » | [Search for messages. Accepts Java regexes Prefix 
Debug As v1Android Application 

Validate 也 2 Android JUnit Test 

Team » | 加 3 Java Applet Alt+Shift+D, A 
Compare With | 加 4Java Application Alt+Shift+D, J 
Restore from Local History.. J 5JUnit Test Alt+Shift+D,T 
Android Tools ER 

Configure 


图 1.28 调试 模式 选择 


随后 选择 开启 Debug 调试 窗口 ,最 终 就 进入 了 调试 界面 ,如 图 1. 29 所 示 。 


CR 业 | “= 9 到 
2 Theeed ledv mail tianperded (breakpoint at ne 15 in Nais | es 
-VM dion ont provide nanior bomadion» a 
Moinherwiy oncromethrdle) ne 15 :8 
feesrementosion calA csoyOnCroeee riery, Burdie) ine O47 3 

Aciviy Tho eed perfor mawneiiy /Acit Trend Sc SoyRer ord. rtrd) En 2627 

ED Te ee 

= es 

上 = ic 


| NW me rows Memon ini EEEE 


ToView [4300677O7ITD) 
m 


如 从 日 “= 日 


4-8y0067680616) 


CTET MEE 


Saved Fers 
ee 


earth ler ressges eeepts on rors Preir mith Pt Eee 日 旧 天 国 


ERIC 


图 1.29 Debug 调试 界面 
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在 调试 的 过 程 中 ,可 以 对 程序 进行 单 步 执行 , 当 执 行 到 断 点 处 时 ,可 以 根据 需要 查看 后 
台 信 息 , 以 判断 程序 是 否 达到 预期 的 执行 效果 。 事 实 上 ,对 程序 进行 调试 的 手段 很 多 ,很 难 
讲 熟 优 熟 劣 ,因此 应 该 根据 当前 情况 做 出 判断 ,选用 最 佳 的 调试 方法 。 在 这 里 只 列举 了 一 个 
最 常用 且 最 基本 的 方法 ,希望 读者 可 以 多 加 练习 ,熟练 掌握 。 
3) 运行 程序 
如 果 在 前 面 的 调试 阶段 中 程序 不 会 再 抛 出 异常 或 是 错误 ,就 可 以 使 用 模拟 器 对 程序 进 
行 仿真 运行 了 。 操 作 非 常 简单 : 首先 选中 项 目 名 并 单 击 右键 ,在 菜单 中 选择 Run as 
Android Application 命令 ,随后 该 程序 将 会 被 模拟 器 运行 。 运 行情 况 如 图 1. 30 所 示 。 


到 而 画 713wm 


hello 


elcome to Android 
Am mm mm 


图 1.30 程序 运行 结果 


从 图 1. 30 可 以 看 到 ,和 预想 的 结果 相同 , 即 在 屏幕 上 输出 ”Welcome to Android” 的 字 
符 串 。 至 此 ,成 功 地 编写 了 一 个 简单 的 Android 程序 。 实 际 上 ,Android 应 用 程序 开发 还 是 
较为 容易 , 难 就 难 在 是 否 能 够 熟练 应 用 Google 所 提供 的 大 量 API, 这 就 要 求 在 平时 开发 的 
过 程 中 养 成 勤学 多 练 的 好 习惯 。 


小 结 
本 章 首 先 介绍 了 什么 是 Dalvik 虚拟 机 ,Dalvik 虚拟 机 有 哪些 功能 ,以 及 它 和 Java 虚拟 


机 有 什么 不 同 之 处 , 接 下 来 介绍 了 如 何 下 载 和 编译 Dalvik 虚拟 机 源码 ,其 中 包括 对 于 Linux 
操作 系统 的 安装 步骤 。 
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第 2 董 
源码 分 析 辅 助 工具 


本 章 主要 内 容 

名 如 何在 Linux 下 用 Vim 搭建 一 个 简易 的 源码 阅读 环境 ? 
全 如 何 静 态 分 析 源 码 得 到 函数 之 间 的 关系 ? 

名 怎样 才能 以 文档 的 形式 得 到 自己 的 注释 ? 

名 如 何 用 GDBSERVER 动态 跟踪 程序 执行 流程 ? 


2.1 本 章 概 述 


Android Dalvik 源码 量 十 分 巨大 ,因此 依靠 一 些 称 手 的 工具 将 大 大 加 快 分 析 进 度 。 由 
于 采用 Ubuntu 10. 04 作为 编译 环境 ,阅读 和 分 析 源 码 都 将 采用 Ubuntu 10. 04 作为 宿主 环 
境 。 其 中 包括 利用 Vim 及 Vim 插件 搭建 一 个 简单 的 源码 阅读 环境 ;利用 Doxygen 工具 生 
成 类 及 函数 调用 关系 图 ;利用 GDBSERVER 调试 跟踪 程序 执行 流程 。 


2.2 Vim 源码 阅读 环境 搭建 


Vim 是 Linux 下 通用 的 编辑 器 ,其 前 身 是 UNIX 下 的 VI, 历 史 十 分 悠久 。 和 普通 的 编 
辑 器 不 一 样 ,Vim 是 有 模式 的 ,这 个 设计 会 让 许多 初学 者 感到 迷惑 ,也 是 其 陡峭 学 习 曲 线 的 
一 部 分 。Vim 中 最 常用 的 模式 是 普通 模式 (Normal Mode) 和 插入 模式 (Insert Mode) 。 

Vim 是 有 模式 的 编辑 器 ,分 别 包 含 普 通 模式 和 插入 模式 。 在 普通 模式 下 ,键盘 的 输入 
会 被 当 作 快 捷 键 ,而 不 是 通常 的 文字 录入 。 相 应 的 文字 录入 则 在 插入 模式 下 完成 。 在 普通 
模式 下 按 i 键 , 则 进入 插入 模式 ,此 时 在 Vim 的 左下 角 应 该 看 到 “插入 ”或 “Insert” 字 样 。 在 
插入 模式 下 的 使 用 方式 和 普通 的 记事 本 是 一 样 的 。 当 想 返 回 普 通 模式 时 ,可 按 Esc 键 。 
Vim 有 一 个 非常 强大 的 帮助 文档 ,如 果 有 些 命令 不 知道 ,可 以 输入 “:help 二 command 二 ”来 
获取 Vim 中 相关 命令 的 帮助 。 

普通 模式 下 的 键盘 快捷 键 如 表 2. 1 所 示 。 

表 2.1 Vim 普通 模式 下 简单 快捷 键 


按键 功 能 按键 功 能 
H 光标 左 移 一 个 字符 x 删除 光标 所 在 的 一 格 字 符 
J 光标 下 移 一 行 :wq 保存 并 退出 
k 光标 上 移 一 行 :!q 不 保存 退出 
1 光标 右 移 一 个 字符 
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在 Ubuntu 10. 04 中 ,默认 安装 的 是 Vi, 相 比 于 Vim 缺少 一 些 功能 ,因此 需要 重新 安装 
Vim。Vim 的 安装 过 程 非常 简单 ,在 终端 中 输入 以 下 命令 ,将 自动 完成 Vim 的 安装 ,如 图 2. 1 
所 示 。 


dalvik@dalvik-laptop:~$ sudo apt-get install vim 
Reading package lists... Done 
Building dependency tree 
Reading state information... Done 
The following extra packages will be installed: 
vim-runtime 
Suggested packages: 
ctags vim-doc vim-scripts 
The following NEW packages will be installed: 
vim vim-runtime 
9 upgraded, 2 newly installed, © to remove and 6 not upgraded. 
Need to get 69B/7,989kB of archives. 
After this operation, 27.3MB of additional disk space will be used. 
Do you want to continue [Y/n]? 咯 


图 2.1 Vim 安装 图 
安装 成 功 后 的 界面 如 图 2. 2 所 示 。 由 于 网 络 问 题 或 源 的 问题 ,可 能 会 有 其 他 错误 。 


ags.vim-tiny by vim-runtime' 

Selecting previously deselected package vim. 

Unpacking vim (from .../vim 2%3a7.2.330-1lubuntu3.1 amd64.deb) ... 
Processing triggers for man-db ... 

Setting up vim-runtime (2:7.2.339-lubuntu3.1) ... 

Processing /usr/share/vim/addons/doc 


Setting up vim (2:7.2.339-1ubuntu3.1) ... 

update-alternatives: using /usr/bin/vim.basic to provide /usr/bin/vim (vim) in a 
uto mode. 

update-alternatives: using /usr/bin/vim.basic to provide /usr/bin/vimdiff (vimdi 
ff) in auto mode. 

update-alternatives: using /usr/bin/vim,basic to provide /usr/bin/rvim (rvim) in 
auto mode. 

update-alternatives: using /usr/bin/vim.basic to provide /usr/bin/rview (rview) 
in auto mode. 

update-alternatives: using /usr/bin/vim.basic to provide /usr/bin/vi (vi) in aut 
0 mode. 

Update-alternatives: using /usr/bin/vim.basic to provide /usr/bin/view (view) in 
auto mode. 

UPde eaLEernet yes: using /usr/bin/vim.basic to provide /usr/bin/ex (ex) in aut 
0 mode. 


dalvik@dalvik-laptop:~$ [| 
2.2 Vim 安装 成 功 后 的 界面 


作为 一 个 可 扩展 的 编辑 器 , Vim 有 非常 强大 的 插件 库 , 几 乎 所 有 插件 都 可 以 在 其 官网 
下 载 得 到 。 在 搭建 源码 阅读 环境 时 ,需要 安装 ctags 和 TagList 插件 。 


1. ctags 


说 明 : ctags 是 Linux 下 的 方便 代码 阅读 的 工具 。 官 方 解 释 的 是 产生 标记 文件 已 帮助 
在 源 文 件 中 定位 对 象 。 通 俗 地 说 ,ctags 扫描 指定 的 源 文 件 , 找 出 其 中 包含 的 语法 元 素 ,并 将 
相关 的 信息 记录 到 文件 中 。 因 此 ,ctags 运行 后 ,将 在 源码 目录 产生 一 个 tags 文件 。 安 装 过 
程 如 图 2.3 所 示 。 

安装 完成 后 ,和 Vim 不 同 的 是 ,可 能 会 出 现 如 图 2. 4 所 示 的 错误 ,不 需要 担心 ,这 没 什 
么 问题 。 

接 下 来 是 ctags 的 配置 。 进 入 Android 源码 dalvik 目录 中 ,运行 ctags -R 生成 tags 文 
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dalvik@dalvik-laptop:~$ sudo apt-get install exuberant-ctags 
Reading package lists... Done 
Building dependency tree 
Reading state information... Done 
The following NEW packages will be installed: 
exuberant-ctags 
8 upgraded, 1 newly installed, © to remove and © not upgraded. 


图 2.3 ctags 安装 图 


Setting up exuberant-ctags (1:5.8-2) ... 

update-alternatives: error: no alternatives for ctags. 

update-alternatives: using /usr/bin/ctags-exuberant to provide /usr/bin/ctags (c 
tags) in auto mode. 

update-alternatives: error: no alternatives for etags. 

update-alternatives: using /usr/bin/ctags-exubeSant to provide /usr/bin/etags (e 
tags) in auto mode. 


图 2.4 etags 安装 后 的 报错 
件 ,如 图 2.5 所 示 。 在 Vim 配置 文件 一 /. vimrc 中 加 入 : set tags 王 [Android 源码 目录 ]/ 
dalvik/tags。 注 意 ,tags 文件 不 能 自动 更 新 ,如 果 大 幅度 更 改 源码 后 ,需要 重新 生成 。 


dalvik@dalvik-laptop:~/android4.4/dalvik$ ctags -R 
dalvik@dalvik-laptop:~/android4.4/dalvik$ ls 


dexgen dvz libnativehelper xf unit-tests 
dexlist dx vm 
dalvikvm dexopt hit I Tests 
dexdump docs libdex opcode-gen tools 


dalvik@dalvik-laptop:~/android4.4/dalviks 0 


图 2.5 ctags 生成 tags 


Vim 已 经 集成 了 对 ctags 的 使 用 。 将 光标 移 至 函数 名 称 或 结构 体 名 上 ,然后 按 快捷 键 : 
G Ctrl 十 ]( 按 下 G, 再 按 下 Ctrl 十 ] 键 ) ,将 会 列 出 相关 的 定义 处 ,选择 相应 的 数字 ,自动 跳 转 
到 相应 的 定义 处 。 想 要 返回 时 , 按 快捷 键 Ctrl 十 工 , 自 动 调 回 原先 位 置 。 


2. TagList 


说 明 : 用 过 Source Insight 的 人 都 应 该 记得 这 么 一 个 功能 : 其 可 以 将 当前 文件 的 宏 ,全 
局 变量 函数 名 称 等 显示 在 Symbol 窗口 ,用 鼠标 单 击 就 可 跳 转 到 相应 的 位 置 。Vim 中 的 
TagList 就 实现 了 这 样 的 功能 。 

安装 : 确保 home 目录 下 有 . vim 目录 ,如 果 没 有 .新 创建 一 个 。 然 后 到 Vim 官网 中 
http://www. vim. org/scripts/download _script. php? src_id 二 19574 下 载 插 件 , 解 压 至 
一 /. vim 目录 中 。 

使 用 : 需要 注意 的 是 Vim 必须 打开 文件 类 型 自动 检测 功能 。 用 Vim 打开 源码 文件 后 ， 
输入 : Tlist, 将 在 右 侧 列 出 函数 定义 等 信息 。 

最 终 安装 配置 好 Vim 后 ,打开 源码 的 界面 如 图 2.6 所 示 。 右 侧 展 示 的 是 dalvik/vm/ 
Init. cpp 文件 的 源码 , 左 侧 是 TagList 展示 的 tag, 分 别 包括 变量 (variable, 图 2.7)、 安 
(macro, 图 2. 8) 类 (class, 图 2.9) 和 函数 名 称 (function ,图 2. 10) 。 

一 般 情况 下 ,有 这 些 工具 就 足够 阅读 代码 了 。 比 如 想 查 看 tag 区 域 中 的 某 个 函数 ,可 以 
先 按 Ctrl 十 W 再 按 H 跳 到 左 侧 的 TagList 区 域 ; 按 方向 键 选 中 要 查看 的 函数 ; 回 车 , 即 可 跳 
转 到 这 个 函数 。 如 果 是 想 跳 转 到 代码 中 的 某 一 个 函数 的 定义 处 ,可 以 按 Ctrl 十 ] 键 , 跳 转 到 
函数 定义 ; 若 该 函数 有 多 个 定义 ,将 显示 所 有 的 函数 定义 ,输入 序号 选中 要 查看 的 函数 即 可 。 
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四 labte 
Dont 
Omit 
DTotltcounmt 
SToc Unrr wucaos 
mnteapstarts ae 


PrintMariveEcTrac 
mdbort 


Ff 
Copy lght (€) 2888 The Mdrold open Source Pral 


orguage governing pernissions and 


regiatersy 
est 
nstipted); 


上 
Init.cpp (/home/dalvik/andr 
variable 
gDvm 


gDvmJni 
gDvmJit 
gDvmICHitCount 


图 2.7 tag 中 的 变量 区 域 


macro 
_STDC_LIMIT MACROS 
kMinHeapStartSize 


kMinHeapSize 
kMaxHeapSize 


图 2.8 tag 中 的 宏 区 域 


class 
ScopedShutdown 


图 2.9 tag 中 的 类 区 域 


2.3 Doxygen 工具 


图 2.6 Vim 外 观 图 


function 


Usage 
show]JdwpHetp 
showersion 
parseMemOption 
handleJdwpOption 
parseJdwpOptions 
enableAssertions 
dvmLateEnableAssertions 
freeAssertionCtrl 
processXjitop 
processXjitmethod 
processOptions 
setCommandLineDefaults 
busCatcher 

blocksignals 
ScopedShutdown [Scopeds 


图 2.10 tag 中 的 函数 区 域 


Doxygen 能 够 分 析 源 码 中 特定 格式 的 注释 ,并 根据 这 些 注释 生成 源码 文档 。 其 优势 是 : 
名 代码 与 文档 能 保持 同步 ; @@ 能 对 文档 做 版 本 管理 。 同 时 ,Doxygen 静态 分 析 源码 ,能 根据 
函数 调用 关系 、 类 间 关 系 等 生成 dot 文件 。Graphviz 能 根据 这 些 dot 文件 生成 相应 的 图 。 
因此 在 安装 时 ,需要 安装 Graphviz。 

首先 安装 Graphviz 工具 。 在 终端 中 安装 Graphviz, 如 图 2. 11 所 示 。 
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dalvik@dalvik-laptop:~/downloads$ sudo apt-get install graphviz 
Reading package lists... Done 
Building dependency tree 
Reading state information... Done 
Suggested packages: 
graphviz-doc 
The following NEW packages will be installed: 
graphviz 
9 upgraded, 1 newly installed, 9 to remove and 9 not upgraded. 
Need to get 435kB of archives. 
After this operation，1,298kB of additional disk space will be used. 
Get:1 http://cn.archive.ubuntu.com/ubuntu/ lucid/main graphviz 2.29.2-8ubuntu3 [ 
435kB] 
Fetched 435kB in Qs (541kB/s) 
Selecting previously deselected package graphviz. 
(Reading database ... 146265 files and directories currently installed.) 
Unpacking graphviz (from .../graphviz 2.29.2-8ubuntu3 amd64.deb) ... 
Processing triggers for man-db ... 
Setting up graphviz (2.29.2-8ubuntu3) ... 


图 2.11 安装 Graphviz 


另外 ,Doxygen 需要 一 些 依赖 ,包括 Flex、bison、g 十 十 等 ,如 果 在 第 1 章 源 码 环境 搭建 
时 没有 安装 这 些 工 具 ,在 进行 下 一 步 前 需要 用 apt-get 安装 这 些 工 具 。 安 装 过 程 和 上 述 的 
Graphviz 是 一 样 的 。 

接 下 来 安装 Doxygen。 到 官网 下 载 源码 包 , 目 前 最 新 的 版 本 是 1. 8. 5, 并 编译 安装 。 步 
又 如 图 2. 12 所 示 。 


dalvik@dalvik-laptop:~/downloads$ tar zxf doxygen-1.8.5.src.tar.gz 
dalvik@dalvik-laptop:~/downloads$ 1s 
doxygen-1.8.5 doxygen-1,.8.5.src.tar.gz taglist 46.zip 
dalvik@dalvik-laptop:~/downloads$ cd doxygen-1.8.5/ 
dalvik@dalvik-laptop:~/downloads/doxygen-1.8.5$ ./configure && make && sudo make 
install 

Autodetected platform linux-g++... 

Checking for GNU make tool... using /usr/bin/make 

Checking for GNU install tool... using /usr/bin/install 

Checking for dot (part of GraphViz)... using /usr/bin/dot 

Checking for perl... using /usr/bin/perl 

Checking for flex... using /usr/bin/flex 

Checking for bison... using /usr/bin/bison 


图 2.12 编译 安装 Doxygen 


编译 并 安装 成 功 后 ,应 该 如 图 2. 13 所 示 ,表示 安装 成 功 。 


/usr/bin/install -d //usr/local/bin 


/usr/bin/install -m 755 bin/doxygen //usr/local/bin 

/usr/bin/install -d //usr/local/man/manl 

cat doc/doxygen.1 | sed -e "S/DATE/ 十 一 月 2913/g”-e "s/VERSION/1.8.5/g" > do 
xygen.1 

/usr/bin/install -m 644 doxygen.1 //usr/local/man/manl/doxygen.1 

rm doxygen.1 


dalvik@dalvik-laptop:~/downloads/doxygen-1.8.5$ 0 


图 2. 13 Doxygen 编译 安装 成 功 后 的 提示 
为 使 Doxygen 能 生成 文档 ,需要 编写 一 个 配置 文件 。 运 行 : 
Goxygen -9 Doxyfile 
将 在 当前 目录 下 生成 一 个 Doxygen 示例 配置 文件 ,名 为 Doxyfile。 配 置 文件 中 对 每 


一 个 配置 参数 都 做 了 详细 的 解释 ,根据 自己 需要 ,修改 参数 值 。 主 要 修改 了 以 下 几 个 
方面 。 
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(1) 输出 语言 选择 中 文 。 
CUTPUT IRNGUGP- Chinese 
(2) 采用 Java Doc 的 注释 风格 ,同时 禁用 了 其 他 风格 ,如 QT、C++ 等 注释 风格 。 
JPVRDOC MTIOERIEF= YES 
(3) 考虑 到 Dalvik VM 中 包含 几 种 不 同类 型 的 语言 ,如 Java、C++ 、Python 和 汇编 , 开 
启 了 OPTIMIZE_OUTPUT_JAVA 和 OPTIMIZE_OIUTPUT_FOR_C。 
(4) 递归 扫描 所 有 文件 夹 , 并 分 析 所 有 类 型 的 变量 和 定义 。 
EXIFACT ALI YES 
(5) 只 输出 HTML 文件 。 
设置 不 要 生成 Latex 和 Chm。 
(6) 夯 出 函数 之 间 调 用 和 被 调用 图 、 类 图 、 继 承 关系 图 等 。 
UML IOK= YES 
CALL GRAPH= YES 
CALIER GFAPH= YES 
(7) 因为 在 Dalvik VM 中 有 许多 的 bash 脚本 , 视 为 C 语言 文件 。 
EXIENSION MFPINS 。” = srC 
(8) 输入 源码 文件 编码 选 为 UTF-8。 
(9) 源码 太 多 ,只 扫描 h、cpp、javac 文件 。 
FTIE PATIEFNS =#.c\ 
* -GEP \ 
*.h\ 
* .java 
(10) 在 后 期 发 现 大 部 分 的 函数 最 后 都 会 归结 到 一 些 异常 处 理 函数 处 ,为 降低 生成 的 调 
用 图 的 重复 性 ,去 掉 了 dvmThrowException、assert、dvmAbort 等 异常 信息 。 
EXCTDTE SYMBOLS 一 donthrowxcepticn \ 


assert \ 
dumabort 


(11) 在 生成 函数 调用 关系 图 时 .需要 很 大 的 内 存 ,为 减少 复杂 性 ,只 生成 三 层 的 函数 调 
用 关系 图 。 


MX DOT GRAPH TEPTH =3 
(12) 开启 预 处 理 宏 WITH_JIT 


PRETEFINED =WITH SELF VERIFICATION \ 
WITH JIT 


同时 在 配置 文件 中 需要 指定 输入 源码 位 置 和 输出 文档 位 置 。 在 配置 好 后 ,运行 
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doxygen, 将 自动 读 取 该 文件 夹 下 的 Doxyfile 并 根据 配置 生成 文档 。 生 成 的 HTML 文档 可 
以 用 浏览 器 直接 浏览 。 

点 拨 “Doxygen 源码 官网 地 址 在 ftp://ftp. stack. nl/pub/users/dimitri/doxygen- 
1. 8. 4. src. tar. gz。 

文档 主要 有 以 下 几 部 分 。 

(1) 文件 夹 之 间 的 调用 关系 ,如 图 2. 14 所 示 。 这 部 分 可 以 比较 直观 地 得 到 各 个 文件 夹 
之 间 的 关系 以 及 所 属 模 块 。 


vm arch 
外 “SK L 
1| jawp |3| native oo reflect 
1 1 
| hprof | [compiler analysis 
2 
« a IN 
alloc interp libdex 
h ty » Y 
os mterp libnativehelper 


图 2.14 文件 夹 关 系 图 


(2) 类 或 结构 体 UML 图 ,如 图 2. 15 所 示 。 


com.android.dexgen.dex.code. 
CatchBuilder 


com.android.dexgen.dex.code. 
StdCatchBuilder 


—method 

一 order 

一 addresses 

—MAX_ CATCH_ RANGE 


+ StdCatchBuilder() 
+ build0) 

+ hasAnyCatches() 
+ getCatchTypes() 

+ build() 

— handlersFor0) 

— makeEntry() 

— rangelsValid() 


图 2.15 类 图 和 UML 图 
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(3) 文件 功能 和 函数 功能 描述 ,如 图 2. 16 和 图 2. 17 所 示 。 


EN 站 017 
: 


过 于 了 所 有 文件， 并 骨科 要 


TR 


这 人 自生 臣 ore 全 和 用 六 开具 


PC ei 


要 和 也 二 个 卡车 汪 对 其 二村 ， 包 训 了 对 卡片 和 的 相关 作 ， 
时 着 一作 作 


图 2.16 文件 功能 展示 


ET 一 让 
| 


IT 


1 


图 2.17 函数 功能 展示 


2.4 GDBSERVER 工具 


Android 系统 在 嵌入 式 设备 上 运行 ,要 想 对 其 进行 调试 ,需要 配置 Host 十 Target 环境 。 
Host 端 使 用 arm-linux-androideabi-gdb, Target 端 使 用 GDBSERVER。 在 调试 过 程 中 ,应 
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用 程序 在 手机 上 运行 ,而 gdb 调试 则 在 Host 端 , 也 就 是 Ubuntu 中 。 
在 Android 1.0 之 后 的 版 本 中 ,GDBSERVER 已 经 被 内 置 在 了 源码 中 。 编译 完 
Android 4.0.4 之 后 ,GDBSERVER 位 于 


~ /working/androidsource/android4.0.4/out/target/product/generic/system/bin 
使 用 GDBSERVER 首先 需要 设置 环境 变量 ,根据 不 同 的 编译 版 本 设置 的 环境 变量 有 
所 不 同 ,但 使 用 的 命令 是 相似 的 。 以 maguro 版 本 为 例 ,在 终端 中 执行 以 下 命令 : 


. build/ervsetiup.sh 


lndh full- maguro- userdebug 


如 果 没 有 物理 机 ,可 以 使 用 模拟 器 版 本 ,此 时 full-maguro-userdebug 变 为 full-eng, 如 


图 2. 18 所 示 。 


dalvik@dalvik-laptop:~/android4.4$ . build/envsetup.sh 
including device/moto/stingray/vendorsetup.sh 
including device/moto/wingray/vendorsetup.sh 
including device/samsung/crespo4g/vendorsetup.sh 
including device/samsung/crespo/vendorsetup.sh 
including device/samsung/maguro/vendorsetup. sh 
including device/: ung/torospr/vendorsetup. sh 
including device/: ung/toro/vendorsetup. sh 
including device/samsung/tuna/vendorsetup.sh 
including device/ti/panda/vendorsetup.sh 
including sdk/bash_completion/adb.bash 
dalvik@dalvik-laptop:~/android4.4$ lunch 


You're building on Linux 


Lunch menu... pick a combo: 

. full-eng 

. full x86-eng 
vbox_x86-eng 
full_stingray-userdebug 
full_ wingray-userdebug 
. full_crespo4g-userdebug 
. full_crespo-userdebug 

. full maguro-userdebug 

. full torospr-userdebug 
19. full toro-userdebug 
11. full_tuna-userdebug 
12. full_panda-eng 


mwvawhwnrm 


Which would you like? [full-eng] 8 


PLATFORM VERSION CODENAME=REL 
PLATFORM VERSION=4.0.4 
TARGET_PRODUCT=full maguro 
TARGET_BUILD VARIANT=userdebug 
TARGET_BUILD TYPE=release 
TARGET_BUILD_APPS= 
TARGET_ARCH=arm 

TARGET ARCH_VARIANT=armv7-a-neon 
HOST_ARCH=x86 

HOST_0S=linux 

HOST_BUILD TYPE=release 

BUILD ID=IMM76L 


dalvik@dalvik-laptop:~/android4.4$ 目 


图 2.18 设置 环境 变量 


接 下 来 主要 有 以 下 几 个 步骤 。 
将 测试 程序 上 传 到 SD 卡 中 ,如 图 2. 19 所 示 。 


adb push 'HEl1lcWprld.zip' /sdcard/ 

如 果 遇 到 问题 : 

failed to cqpy "HEIldbrld.zip' to '/adard/ /Hel1omorld.zip': Read- cnly file systen 
解决 方法 : 重新 挂 载 文件 系统 即 可 。 


adb shel] mpunt -oo Tempunt rw / 


dalvik@dalvik-laptop:~/android4.4$ adb devices 
List of devices attached 
961498F8E9D6695614 device 


dalvik@dalvik-laptop:~/android4.4$ adb push “HeLLowWortd.zip' /sdcard/ 
9 KB/s (577 bytes in 9.956s) 
datvikedatvik-taptop:~/android4.4$ 中 


图 2.19 上 传 测试 程序 至 SD 卡 中 
接着 开启 GDBSERVER。 运 行 以 下 命令 以 在 终端 执行 需要 调试 的 程序 : 


adb roct 
adb forward tap:5039 tap:5039 
adb shell GUBSEFVER :5039 dalvikwm - op /sdcard/HellcWorld.zip Helloworld 


终端 应 该 有 如 下 显示 ,如 图 2. 20 所 示 。 


dalvik@dalvik-laptop:~/android4.4$ adb root 

adbd is already running as root 

dalvik@dalvik-laptop:~/android4.4$ adb forward tcp:5639 tcp:5839 
dalvik@dalvik-laptop:~/android4.4$ adb shell gdbserver :5639 dalvikvm -cp /sdcar 
d/Helloworld.zip Helloworld 

Process dalvikvm created; pid = 745 

日 stening on port 5939 


图 2.20 开启 GDBSERVER 


然后 新 建 一 个 终端 ,在 命令 行 中 输入 以 下 代码 ,在 Host 端 打 开 gdb, 如 图 2. 21 所 示 。 


amm linw- androidesbi— gdb out/target/prodct/maguro/synbols/systen/bin/dalvikm 


dalvik@dalvik-laptop:~/android4.4$ arm-linux-androideabi-gdb out/target/product/ 
maguro/symbols/system/bin/dalvikvm 

GNU gdb (GDB) 7.1-android-gg2 

Copyright (C) 2916 Free Software Foundation, Inc. 

License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 

and "show warranty" for details. 

This GDB was configured as "--host=i686-linux-gnu --target=arm-elf-linux". 

For bug reporting instructions, please see: 
<http://www.gnu.org/software/gdb/bugs/>... 

Reading symbols from /home/dalvik/android4.4/out/target/product/maguro/symbols/s 
ystem/bin/dalvikvm.. .done. 

(gdb) 品 


图 2.21 开启 gdb 
在 开启 gdb 后 需要 设置 库 路 径 , 分 别 是 : 


set solib- absolute— prefix out/target/prodct/maguro/synbos 
set solib- seardh- path out/target/product /meguro/syrbos/system/1ib 
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之 后 设置 监听 端口 ,需要 注意 的 是 ,端口 号 和 第 二 步 设置 的 端口 应 该 是 一 样 的 。 
target remote :5039 
成 功 连接 上 GDBSERVER 后 ,两 个 终端 的 界面 分 别 如 图 2. 22 和 图 2. 23 所 示 。 


dalvik@dalvik-laptop:~/android4.4$ adb shell gdbserver :5639 datvikvm -cp /sdcar 
d/Helloworld.zip Helloworld 

Process dalvikvm created; pid = 745 

Listening on port 5639 

Remote de5ugging from host 127.6.9.1 


图 2.22 成 功 连接 上 后 手机 端的 反应 


dalvik@dalvik-laptop:~/android4.4$ arm-linux-androideabi-gdb out/target/product/ 
maguro/symbols/system/bin/dalvikvm 

GNU gdb (GDB) 7.1-android-gg2 

Copyright (C) 2916 Free Software Foundation, Inc. 

License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> 
This is free software: you are free to change and redistribute it. 

There is NO WARRANTY, to the extent permitted by law. Type "show copying" 

and "show warranty" for details. 

This GDB was configured as "--host=i686-linux-gnu --target=arm-elf-linux". 

For bug reporting instructions, please see: 
<http://www.gnu.org/software/gdb/bugs/>... 

Reading symbols from /home/dalvik/android4.4/out/target/product/maguro/symbols/s 
ystem/bin/dalvikvm. . .done. 

(gdb) 品 


图 2.23 成 功 连接 上 GDBSERVER 


接 下 来 就 可 以 设置 断 点 ,并 跟踪 执行 了 ,如 图 2. 24 所 示 。 
(gdb) b main 
Breakpoint 1 at 9x8716: file dalvik/dalvikvm/Main.cpp, line 152. 
(gdb) [ 


图 2.24 设置 断 点 


小 结 


本 章 介绍 了 一 些 辅助 源码 分 析 的 工具 ,包括 Vim、Doxygen\GDBSERVER ,并 介绍 了 其 
使 用 的 方法 ,为 后 期 的 阅读 和 分 析 打 下 了 基础 。 其 中 ,GDBSERVER 的 使 用 一 定 要 熟练 党 
担 , 今 后 大 部 分 的 源码 分 析 ,都 需要 这 个 步骤 的 验证 。 


Go 
Dex 文 件 及 Dalvik 字 节 码 格式 解析 


本 章 主要 内 容 

避 Dex 文件 是 什么 ? 

名 Dex 文件 具有 怎样 的 特点 ? 

局 Dex 文件 具有 怎样 的 结构 ? 

避 Dalvik 字 节 码 和 Java 字 节 码 有 怎样 的 区 别 且 具有 怎样 的 特点 ? 
名 Odex 文件 是 什么 ? 它 和 Dex 文件 有 着 怎样 的 关系 ? 


Dex 文件 是 Android 系统 的 可 执行 文件 ,包含 应 用 程序 的 全 部 操作 指令 以 及 运行 时 数 
据 。 当 虚拟 机 在 执行 一 个 应 用 程序 时 ,需要 实时 地 根据 程序 需要 从 Dex 文件 中 读 取 相应 的 
数据 以 保证 程序 的 正确 运行 ,可 以 说 Dex 文件 是 一 个 Android 应 用 的 根本 。 正 因为 如 此 ， 
我 们 需要 学 习 Dex 文件 结构 以 及 内 含 的 Dalvik 字 节 码 , 以 更 加 深入 地 了 解 Dalvik 虚拟 机 
运行 机 制 。 


3.1 本 章 概述 


Dex 文件 是 Dalvik 虚拟 机 的 可 执行 文件 ,由 于 Dalvik 是 一 种 针对 嵌入 式 设 备 而 特殊 设 
计 的 Java 虚拟 机 ,因此 ,Dex 文件 与 标准 的 Class 文件 在 结构 设计 上 有 着 本 质 上 的 区 别 。 另 
外 ,Dalvik 运行 在 资源 受 限 的 嵌入 式 系统 中 ,因此 为 了 适应 这 种 严 苛 的 运行 环境 ,标准 的 
Java 程序 在 经 过 编译 后 ,还 需要 通过 dx 工具 将 在 编译 过 程 中 所 生成 的 数 个 Class 文件 整合 
成 一 个 Dex 文件 。 这 样 做 的 目的 就 是 使 其 中 各 个 类 能 够 共享 数据 ,在 一 定 程度 上 降低 了 元 
余 , 同 时 也 使 得 文件 结构 十 分 紧凑 。 实 验 表明 ,Dex 文件 是 传统 Jar 文件 大 小 的 50% 左 右 。 
图 3.1 展示 了 Dex 文件 结构 的 特点 。 

为 了 进一步 提高 性 能 , 当 一 个 真实 设备 在 执行 目标 Dex 文件 之 前 ,需要 优化 该 Dex 文 
件 并 生成 与 之 对 应 的 Odex 文件 ,随后 该 Odex 文件 将 替换 原 Dex 文件 被 Dalvik 虚拟 机 引 
用 执行 。Odex 文件 本 质 上 仍然 是 一 个 Dex 文件 .只 是 针对 目标 平台 的 特性 ,在 原 Dex 文件 
的 基础 上 进行 了 一 系列 的 优化 ,主要 体现 在 对 其 内 部 所 包含 的 字 节 码 进行 的 一 系列 处 理 , 主 
要 包括 字 节 码 验 证 ,替换 优化 以 及 空 方法 的 消除 等 ,使 得 优化 后 的 Dex 文件 在 被 虚拟 机 执 
行 时 ,能 保持 相当 不 错 的 执行 速度 。 
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jar .dex 
-class file 
Constant pools | String_ids 
Constant pools 
Other data SS - 
1 | | Type ids 
| Constant pools 
,class file 1 - 
1 Proto ids 
Constant pools ontant pools 
Other data | 十 -3 | Ficld ids 
Constant pools 
.class file | _ | Method ids 
Constant pools | Constant pools 
1 
Other data 册 EN, [| Other data 


图 3.1 Jar 文 件 与 Dex 文 件 结构 对 比 图 


3.2 Dex 文件 格式 


Dex 文件 的 格式 从 宏观 上 讲 是 非常 清晰 且 明 了 的 ,但 是 如 果 细 究 其 中 各 类 数据 之 间 的 
关联 关系 又 是 一 件 非常 令 人 头疼 的 事情 ,因此 ,在 本 章 中 在 对 Dex 文件 进行 原理 性 分 析 的 
同时 ,还 将 结合 一 个 实际 Dex 文件 的 反 编 译 结果 对 这 部 分 内 容 进 行 讲 解 ,希望 读者 可 以 从 
理论 与 实际 两 方面 对 Dex 文件 的 结构 进行 理解 学 习 。 

点 拨 Android 系统 为 开发 者 提供 了 一 个 dexdump 工具 ,其 作用 是 对 一 个 Dex 文件 进 
行 反 编 译 , 将 其 中 的 二 进 制 数 据 转化 为 十 六 进 制 数据 ,并 给 出 相关 的 辅助 注释 信息 ,以 帮助 
使 用 者 更 好 地 理解 Dex 文件 结构 ,该 工具 的 具体 使 用 方法 请 参见 第 4 章 。 


3.2.1 Dex 文件 中 的 数据 结构 


在 介绍 Dex 文件 结构 与 内 容 之 前 ,有 必要 先 讲解 一 下 Dex 文件 中 所 用 到 的 一 些 基 本 的 
数据 类 型 ,如 表 3. 1 所 示 。 

前 8 个 属于 常用 的 标准 数据 结构 ,在 此 就 不 再 过 多 介绍 。 而 sleb128、uleb128 以 及 
uleb128pl 是 Dex 文件 中 特有 的 数据 类 型 。 根 据 开 发 文档 (位 于 Android 源码 的 Dalvik/ 
docs 路 径 下 的 dex-format. html) 的 描述 ,每 一 个 leb128 都 是 由 1 一 5B 组 成 ,通过 这 种 组 合 
形式 表示 一 个 32 位 的 数据 。 对 于 每 一 个 字 节 都 有 如 下 的 规定 : 最 高 位 为 标志 位 ,其 余 7 位 
为 有 效 位 , 当 标志 位 为 1 时 表示 需要 拼接 上 第 二 个 字 节 ; 当 第 二 个 字 节 的 最 高 位 也 为 1 时， 
则 需要 拼接 上 第 三 个 字 节 ,以 此 类 推 。 但 需要 注意 的 是 ,leb128 最 多 由 5 个 字 节 拼接 而 成 ， 
故 第 5 个 字 节 的 最 高 位 只 能 为 0。 图 3. 2 表示 了 一 个 leb128 数据 . 它 只 用 到 了 两 个 字 节 ,其 
结构 如 图 3.2 所 示 。 

由 于 Dex 文件 结构 的 内 容 和 leb128 原理 实现 关系 不 大 , 故 不 再 对 leb128 数据 类 型 的 
源码 实现 进行 过 多 的 介绍 ,其 源码 位 于 dalvik/libdex/Leb128. bh 文件 中 ,有 兴趣 的 读者 可 以 
对 该 数据 结构 的 实现 源码 进行 研究 学 习 . 已 明确 其 中 的 技术 细节 。 
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表 3.1 Dex 文件 所 应 用 的 基础 数据 结构 


类 型 含义 
byte 占用 8b, 表 示 1B 的 有 符号 数 
ubyte 占用 8b, 表 示 1B 的 无 符号 数 
short 占用 16b, 表 示 2B 的 有 符号 数 , 低 字 节 序 
ushort 占用 16b, 表 示 2B 的 无 符号 数 , 低 字 节 序 
int 占用 32b, 表 示 4B 的 有 符号 数 , 低 字 节 序 
uint 占用 32b, 表 示 4B 的 无 符号 数 , 低 字 节 序 
long 占用 64b, 表 示 8B 的 有 符号 数 , 低 字 节 序 
ulong 占用 64b, 表 示 8B 的 无 符号 数 , 低 字 节 序 
sleb128 有 符号 LEB128 ,其 长 度 可 变 ,1 一 5B 
uleb128 无 符号 LEB128, 其 长 度 可 变 ,1 一 5B 
ulebl28p1 无 符号 LEB128 值 加 1, 其 长 度 可 变 ,1 一 5B 
Bitwise diagram of a two-byte LEB128 value 
First byte Second byte 
1 | bite | bis | bit, | bie | bit, | bit, | bie | 0 | bits | bit,s | bit, | bito| bie | bits | bit 


图 3.2 leb128 数据 结构 示意 图 


点 拨 在 实际 的 源码 编写 中 ,开发 人 员 常 用 uX 表示 数据 结构 中 成 员 变量 的 数据 类 型 ， 
其 中 义 的 值 可 以 为 1.2、4, 分 别 表 示 1 字 节 数 、2 字 节 数 以 及 4 字 节 数 。 


3.2.2 Dex 文件 结构 分 析 

从 宏观 上 讲 ,Dex 文件 的 结构 很 简单 ,实际 上 就 是 由 多 个 不 同 的 结构 体 数据 以 首尾 相 接 
的 方式 拼凑 而 成 。 首 先 直观 地 介绍 一 下 Dex 文件 都 包含 哪些 数据 .数据 是 以 怎样 的 方式 排 
列 以 及 这 些 数据 的 主要 功能 ,如 表 3. 2 所 示 。 


表 3.2 ”Dex 文件 各 部 分 数据 含义 


数据 名 称 含义 

header Dex 文件 的 头 部 ,记录 Dex 文件 的 相关 属性 

string_ids 字符 串 数据 索引 ,记录 了 各 个 字符 处 在 数据 区 的 地 址 偏 移 量 

type_ids 类 型 数据 索引 ,记录 了 各 个 类 型 的 字符 串 索 引 

proto_ids 原型 数据 索引 ,记录 了 方法 声明 的 字符 串 、 返 回 类 型 字符 串 ,参数 列表 
field_ids 字段 数据 索引 ,记录 了 所 属 类 声明 类 型 以 及 方法 名 等 信息 
method_ids 类 方法 索引 ,记录 方法 所 属 类 名 ,方法 声明 以 及 该 方法 名 等 信息 
class_defs 类 定义 数据 ,记录 了 指定 类 各 类 信息 ,包括 接口 . 超 类 、 类 数据 偏 移 量 等 
data 数据 区 ,保存 着 各 个 类 的 真实 数据 

link_data 连接 数据 区 
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根据 表 3. 2 可 以 对 Dex 文件 的 整体 结构 有 一 个 直观 的 了 解 , 但 是 仍 不 能 明确 Dex 文件 
内 部 数据 之 间 的 关联 关系 ,下 面 将 逐一 对 以 上 各 个 部 分 数据 进行 介绍 。 


1. header 


header 是 Dex 文件 的 文件 头 ,简单 地 记录 了 Dex 文件 的 一 些 基本 信息 ,以 及 其 大 致 的 
数据 分 布 。Dex 文件 头 部 的 总 长 度 是 固定 的 0x70, 其 中 每 一 信息 项 所 占用 的 内 存 空 间 也 是 
相应 固定 的 ,例如 ,magic" 字 段 所 占用 的 内 存 空 间 即 为 8B。 这 样 做 的 好 处 是 ,虚拟 机 在 处 
理 目标 Dex 文件 的 初期 ,可 以 不 用 考虑 Dex 文件 的 多 样 性 ,而 根据 约定 俗 成 的 规则 读 取 文 
件 头 , 即 可 获取 目标 Dex 文件 的 一 个 大 致 信息 。 表 3. 3 展示 了 Dex 文件 头 的 内 部 结构 以 及 
所 包含 的 各 类 数据 。 


表 3.3 Dex 文件 的 头 部 的 信息 


字段 名 称 偏 移 值 | 长 度 描 述 
magic 0x0 8 “Magic” 值 , 即 魔 数 字段 ,格式 如 “dex/n035/0” 
Cheaksum 0x8 4 校 验 码 
signature 0xC 20 SHA-1 签名 
File_size 0x20 4 Dex 文件 总 长 度 
Header_size Ox24 4 文件 头 长 度 ,009 版 本 = 二 0x5C,035 版 本 = 二 0x70 
Endian_tag 0x28 4 标示 字 节 顺序 的 常量 
Link_size 0x2C 4 链接 段 的 大 小 ,如 果 为 0 就 是 表示 是 静态 链接 
Link_off 0x30 4 链接 段 的 开始 位 置 
Map_off 0x34 4 Map 数据 基 址 
String_ids_size 0x38 4 字符 串 列 表 中 字符 串 个 数 
String_ids_off 0x3C 4 字符 串 列 表 基 址 
Type _ids_size 0x40 4 类 列表 里 类 型 个 数 
Type _ids_off Ox44 4 类 列表 基 址 
Proto_ids_size 0x48 4 原型 列表 里 原型 个 数 
Proto_ids_off 0x4C 4 原型 列表 基 址 
Field_ids_size 0x50 4 字段 列表 里 字段 个 数 
Field_ids_off 0x54 4 字段 列表 基 址 
Method_ids_size 0x58 4 方法 列表 里 方法 个 数 
Method_ids_off 0x5C 4 方法 列表 基 址 
Class_defs_size 0x60 4 类 定义 表 中 类 的 个 数 
Class_defs_off Ox64 4 类 定义 列表 基 址 
Data_size 0x68 4 数据 段 的 大 小 ,必须 以 4 字 节 对 齐 
Data_off 0x6C 4 数据 段 基 址 
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2. string_ids 


这 一 区 域 中 存储 的 是 Dex 文件 字符 串 资源 的 索引 信息 ,实际 上 ,该 索引 信息 是 目标 字 
符 串 在 Dex 文件 数据 区 所 在 的 真实 物理 偏 移 量 。 读 者 可 能 会 问 , 虚 拟 机 是 通过 什么 方式 读 
取 这 个 索引 信息 的 呢 ? 还 记得 在 介绍 header 的 时 候 , 曾 提 到 虚拟 机 需要 一 种 约定 俗 成 的 规 
则 ,才能 对 目标 数据 进行 正确 的 访问 ,这 个 思想 在 这 部 分 数据 区 也 是 成 立 的 。 在 本 区 域 中 ， 
Google 的 开发 人 员 规 定 了 一 种 结构 体 一 一 DexStringId, 先 看 下 其 函数 定义 : 

代码 清单 3.1 dalvik/vm/libdex/DexFile. h:DexStringld 函数 定义 

Struct DexStringrd{ 

ud stringpataoff; /* 在 Dex 文 件 中 的 实际 偏 移 量 * / 

}; 

该 数据 结构 只 有 stringDataOff 一 个 成 员 变 量 , 其 记录 了 目标 字符 串 在 Dex 文件 中 的 实 
际 偏 移 量 , 当 虚拟 机 想 要 读 取 该 字符 串 时 ,只 需 将 Dex 文件 在 内 存 中 的 起 始 地 址 加 上 
stringDataOff 所 指 的 偏 移 量 , 即 可 得 到 该 字符 串 在 内 存 中 的 实际 物理 地 址 。 代 码 清单 3. 2 
是 一 段 Dex 文件 中 经 过 反 编 译 的 string_ids 字符 串 索引 信息 。 

点 拨 ”在 Dex 文 件 中 ,每 个 字符 串 都 对 应 一 个 DexStringId 数据 结构 ,该 数据 结构 的 大 
小 为 4B, 是 一 个 确定 的 量 。 同 时 ,虚拟 机 可 以 通过 头 文件 中 的 String_ids_size 变量 知道 当 
前 Dex 文件 中 字符 串 的 总 数 , 也 就 是 string_ids 区 域 中 DexStringId 数据 结构 的 总 数 ,因此 ， 
虚拟 机 通过 简单 的 乘法 运算 即 可 实现 对 该 索引 资源 进行 正确 的 访问 。 

下 面 是 一 段 Dex 文件 中 经 过 反 编 译 的 string_ids 字符 串 索 引信 息 。 

代码 清单 3. 2 string_ids 字符 串 索 引资 源 实 例 


000070: ”4202 0000 | string data off: 00000242 [0] "j:" 
000074: 4702 0000 | string data off: 00000247 [1] <init>" 
000078: ”4f02 0000 | string data off: 0000024f [2] "I" 
00007c: ” 5202 0000 | string data off: 00000252 [3] "TL" 
000080: ” 5502 0000 | string data off: 00000255 [4] "LI" 
000084: 5902 0000 | string data off: 00000259 [5] "LL" 
000088: ” 5d02 0000 | string data off: 0000025d [6] "LIoop2;" 


0000b8: ” 0803 0000 | string data off: 00000308 [12] "main" 

0000bc: 0e030000 | string data off: 0000030e [13] "out" 

0000c0: ” 1303 0000 | string data off: 00000313 [14] "println" 

0000c4: ” 1c03 0000 | string data off: 0000031c [15] "toString" 

其 中 ,左边 两 列 信息 分 别 表示 的 是 Dex 文件 内 部 地 址 以 及 存储 的 实际 内 容 , 而 右边 是 
dexdump 工具 所 给 出 的 辅助 注释 信息 。 下 面 依据 这 段 反 编 译 数据 对 string_ids 字符 串 索引 
信息 区 域 进 行 介绍 。 

首先 观察 左边 两 列 数据 ,在 前 面 曾 介绍 Dex 文件 头 header 的 长 度 即 为 固定 的 0x70, 所 
以 Dex 文 件 中 字符 串 索 引 区 第 一 项 数据 的 起 始 地 址 即 为 000070, 该 项 数据 内 容 是 4202 
0000 ,根据 高 位 在 后 的 存储 规则 ,经 过 整理 后 这 段 数据 即 为 00000242 ,我 们 发 现 该 段 数据 占 
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用 了 4B, 正 好 对 应 着 前 面 所 分 析 的 DexStringId 数据 结构 的 大 小 。 而 数据 00000242 代表 的 
是 什么 意思 呢 ? 我 们 看 到 右边 的 辅助 注释 信息 string_data_off: 00000242 [0] " j:", 其 中 
string_data_off: 00000242 说 明 该 00000242 数据 表示 的 是 字符 串 数据 在 Dex 文件 中 的 地 
址 偏 移 量 ;而 " j:" 表 示 的 是 正 是 该 字符 串 ;[0] 表 示 的 是 该 字符 串 序 号 。 

为 了 证 明 分 析 的 正确 性 ,直接 定位 到 Dex 文件 的 00000242 地 址 处 ,其 十 六 进 制 数据 
如 下 : 

代码 清单 3.3 字符 串 数 据 的 实际 存储 实例 

000242: 03 lutf16 size: 00000003 

000243: 206a 3a00 [Del Li 

该 读 取 过 程 如 下 : 虚拟 机 首先 根据 字符 串 索引 信息 获得 第 一 条 字符 串 的 Dex 文件 内 部 
地 址 偏 移 , 即 00000242 ,随后 虚拟 机 将 读 取 00000242 位 置 的 第 一 个 字 节 ,在 本 例 中 该 值 为 
03, 即 表示 从 00000242 后 面 一 个 地 址 00000243 开始 至 00000246 为 该 字符 串 的 实际 存储 位 
置 ,其 值 206a 3a00 经 过 转化 即 可 得 到 字符 串 ”*j: ”, 虚 拟 机 通过 这 种 方式 即 可 获取 到 一 个 字 


3. type_ids 


在 这 一 区 域 中 存储 的 是 类 型 资源 的 索引 信息 ,本 着 和 string_ids 区 域 中 相同 的 设计 思 
想 ,开发 人 员 也 为 其 规定 了 相应 的 数据 结构 一 一 DexTypeld 用 于 存储 这 部 分 信息 。 首 先 观 
察 一 下 该 数据 结构 的 函数 定义 。 

代码 清单 3.4 dalvik/vm/libdex/DexFile. h:DexTypeld 数据 结构 函数 定义 


Struct DexTypeId{ 
ud descriptorTdx; /* 指向 字符 串案 引 表 * / 

Bs 

在 Dex 文件 中 ,类 型 是 以 字符 串 的 形式 保存 在 数据 区 中 ,因此 ,DexTypeld 数据 结构 中 
的 descriptorIdx 变量 保存 的 是 目标 类 型 在 字符 串 索 引 表 中 的 序列 号 。 

在 头 文件 中 ,Type_ids_size 变量 用 于 标示 type_ids 资源 区 中 所 记录 的 类 型 总 数量 , 即 
DexTypeld 数据 结构 的 个 数 , 和 DexStringId 一 样 ,该 数据 结构 的 大 小 也 是 固定 为 4B。 因 
此 , 当 数 量 的 单位 与 大 小 都 明确 的 前 提 下 ,虚拟 机 也 可 以 实现 对 这 部 分 资源 的 正确 访问 。 

在 这 里 ,同样 根据 一 段 实例 数据 讲解 类 型 索引 资源 的 实际 构造 与 应 用 。 

代码 清单 3.5 type_ids 类 型 索引 资源 实例 

000c8: 0200 0000 | descriptor idx: 00000002 | [0]I 

0000cc: 0600 0000 | descriptor idx: 00000006 | [IILoop2 

0000d0: 0700 0000 cc | descriptor idx: 00000007 | [2]Ljava/io/PrintStream 

0000d4: 0800 0000 cc | descriptor idx: 00000008 | [3]Ijava/langy/abject 

000038: 0900 0000 Cc | descriptor idx: 00000009 | [4]ljava/lang/String 

0000dc: 0a00 0000 cc | descriptor idx: 0000000a | [5]Ijava/lang/StringBuilder 

0000e0: 0b00 0000 cc| descriptor idx: 0000000b | [6]Ljava/lang/System 

0000e4: 0a00 0000 cc | descriptor idx: 0000000d | DIV 

1 


0000e8: 0f00 0000 Gescriptor idx: 0000000f | [8] [Ljava/lang/String 
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以 上 为 类 型 索引 资源 的 反 编 译 数 据 , 左 边 一 列 为 Dex 文件 内 部 偏 移 地 址 ,中 间 和 右边 
一 列 为 反 编译 生成 的 辅助 信息 。 该 部 分 资源 和 字符 串 索 引资 源 的 存储 方式 相似 ,都 是 以 相 
应 的 数据 结构 为 单位 顺 次 存储 。 以 该 表 的 第 一 项 为 例 , 虚 拟 机 首先 读 取 0000c8 地 址 的 数 
据 ,该 数据 即 为 第 一 个 DexTypeld 数据 结构 中 descriptorIdx 成 员 变量 所 保存 的 数据 ,在 本 
例 中 该 值 为 0200 0000, 根 据 数据 高 位 在 后 的 存储 原则 ,该 值 实际 为 00000002, 即 表示 为 字 
符 串 索引 表 中 的 00000002 项 ,可 以 通过 前 面 介绍 的 方法 , 找 出 用 于 表示 该 类 型 的 字符 串 , 具 
体 的 过 程 就 不 再 袭 述 。 

经 过 实际 查找 发 现 ,用 于 表示 该 类 型 的 字符 串 确实 为 “I”, 即 和 反 编 译 生成 的 辅助 信息 
相同 。 读 者 可 以 根据 手边 的 实例 Dex 文件 对 存储 结构 进行 验证 。 


4. proto_ids 


在 这 一 区 域 中 存储 的 内 容 是 原型 资源 的 索引 信息 ,数据 结构 DexProtold 将 负责 规格 化 
这 些 索 引信 息 ,DexProtold 数据 结构 的 函数 定义 如 下 。 
代码 清单 3.6 dalvik/vm/libdex/DexFile. h:DexProtold 数据 结构 函数 定义 


ud ShortyTdxy /* 方 法 声明 字符 串 ,指向 字符 串 索 引 表 * / 
u4 returntTypeIdxy /* 方 法 返回 类 型 ,指向 字符 串 索引 表 * / 
u4 parameterOff; /* 参数 列表 ,该 列表 是 一 个 DesrypeList 数 据 结构 * / 


相 比 于 前 面 两 种 信息 资源 的 存储 格式 ,原型 数据 索引 信息 相对 较为 复杂 ,前 两 个 变量 较 
好 理解 ,其 所 代表 的 真实 资源 都 是 字符 串 。parameterOff 变量 就 相对 复杂 ,其 指向 一 个 
DexTypeList 数据 结构 ,而 该 数据 结构 的 函数 定义 如 下 。 

代码 清单 3.7 dalvik/vm/libdex/DexFile. h:DexTypeList 数据 结构 函数 定义 


Struct DexTypeList{ 
ud size; /* 表示 DexTypeItem 数 据 结 构 的 个 数 * / 
DexTypeTltem list [size]; /x DexTypeItem 数据 结构 列表 * / 


了 


可 以 看 到 ,其 中 size 变量 记录 了 方法 的 参数 的 个 数 ,下 面 的 DexTypeltem 数据 结构 列 
表 则 依次 记录 了 各 个 参数 的 类 型 。 再 看 下 DexTypeltem 数据 结构 的 函数 定义 。 
代码 清单 3.8 dalvik/vm/libdex/DexFile. h:DexTypeltem 数据 结构 函数 定义 


Struct DexTypeItem{ 
tu2 typelox; /* 表示 参数 的 类 型 ,其 指向 Dexryperd 索 引 表 * / 
BB 
其 中 ,typeldx 变量 指向 类 型 资源 索引 表 . 虚 拟 机 通过 该 变量 即 可 获取 相应 参数 的 类 型 。 

看 到 这 里 ,想必 有 读者 会 有 一 个 疑问 ,DexTypeList 数据 结构 中 所 记录 的 DexTypeltem 
数量 是 不 确定 的 ,因此 会 导致 DexTypeList 数据 结构 的 对 象 的 大 小 也 不 能 确定 ,最 终 是 不 
是 也 会 使 DexProtoId 数据 结构 的 实例 对 象 也 会 出 现 大 小 不 一 的 情况 ,如 果 是 ,那么 虚拟 机 
该 如 何 访问 不 规则 的 proto_ids 数据 资源 ? 
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Google 的 开发 者 当然 不 会 让 这 种 情况 出 现 , 回 过 头 仔细 观察 一 下 DexProtold 数据 结 
构 的 第 三 个 成 员 变量 parameterOff, 其 数据 类 型 是 u4 ,表示 占用 4B 的 内 存 资源 ,应 该 是 一 
个 Dex 文件 内 部 的 偏 移 地 址 ,该 地 址 就 应 该 是 其 DexTypeList 数据 结构 的 偏 移 地 址 。 
此 ,对 于 DexProtold 数据 结构 来 说 ,其 大 小 也 是 一 个 固定 值 , 即 为 12B。 从 头 文件 的 Proto_ 
ids_size 变量 中 获取 原型 方法 的 数量 ,也 就 是 接 下 来 DexProtold 数据 结构 的 个 数 , 故 虚拟 机 
也 可 以 根据 一 贯 的 原则 实现 对 proto_ids 区 域 的 数据 进行 正确 的 访问 。 

相对 前 面 两 类 资源 ,原型 索引 资源 相对 复杂 ,下 面 仍 通过 一 段 实 例 数据 进行 讲解 。 

代码 清单 3.9 Dex 文件 中 proto_ids 类 型 索引 资源 实例 


| [0] java.lang.String proto() 


O000ec: 0300 0000 | shorty idx: 00000003 // "LI" 

0000f0: 0400 0000 | retum type idx: 00000004 // java.lang.String 
0000f4: 0000 0000 | parameters off: 00000000 

| [1] java.lang.StringBuilder proto (int) 

0000f8: 0400 0000 | shorty idx: 00000004 // "TI" 

O000fc: 0500 0000 | retum type idx: 00000005 // java.lang.StringBuilder 
000100: 2c02 0000 | parameters off: 0000022c 

| [2] java.lang.StringBuilder proto (java. lang.String) 

000104: 0500 0000 | shorty idx: 00000005 // "TIL" 

000108: 0500 0000 | retum type idx: 00000005 // java.lang.StringBuilder 
00010c: 3402 0000 | parameters off: 00000234 


前 面 讲 到 ,DexProtold 数据 结构 的 大 小 为 12B, 以 第 一 表 项 java. lang. String 的 原型 索 
引资 源 为 例 ,其 数据 地 址 起 始 于 0000ec, 结 束 于 0000f7 ,数据 总 量 正好 为 12B。 在 这 部 分 数 
据 中 ,前 4 个 字 节 的 数据 为 DexProtold 数据 结构 成 员 变 量 ShortyIdx 所 存储 的 值 ,该 数据 
表示 字符 串 索 引 表 中 表 项 的 序号 ,中 间 4 个 字 节 数据 为 成 员 变 量 returnTypeldx 所 存储 的 
值 , 和 ShortyIdx 变量 一 样 表示 字符 串 索引 表 中 表 项 的 序号 以 及 后 面 4 个 字 节 数据 为 成 员 
变量 parameterOff 所 存储 的 值 , 该 值 是 一 个 Dex 文件 的 内 部 地 址 ,该 地 址 直接 指向 前 面 讲 
到 的 DexTypeList 数据 结构 。 巾 于 分 析 方 法 相似 , 故 本 书 就 不 再 对 DexTypeList 数据 结构 
以 及 和 它 相 关 的 DexTypeltem 数据 结构 进行 实例 分 析 , 但 仍 希 望 读者 可 以 利用 空闲 时 间 ， 
通过 一 个 经 过 反 编 译 的 Dex 文件 对 上 面 两 种 未 介绍 的 数据 结构 进行 研究 ,以 达到 学 练 结合 
的 目的 。 

通过 上 面 的 分 析 ,发 现在 原型 资源 索引 区 中 ,其 数据 存储 方式 也 是 以 结构 体 为 单位 进行 
顺序 排列 。 

点 拨 事实 上 ,在 Dex 文 件 中 的 数据 都 是 以 数据 结构 顺序 排列 的 形式 保存 的 ,虽然 不 
同 部 分 的 数据 之 间 没 有 明确 的 界限 ,但 虚拟 机 可 以 通过 Dex 文件 头 获取 相关 数据 结构 的 数 
量 , 同 时 各 部 分 资源 的 数据 结构 在 内 存 中 所 占用 的 宽度 是 固定 的 ,因此 虚拟 机 只 需要 通过 简 
单 的 乘法 运算 即 可 获得 各 部 分 资源 的 实际 存储 位 置 ,由 此 便 可 以 实现 对 各 部 分 资源 的 正确 
访问 。 


5. field_ids 


在 这 一 区 域 中 存储 着 字段 资源 的 索引 信息 ,在 这 里 用 到 数据 结构 DexFieldId 实现 对 字 
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段 资源 索引 信息 的 规格 化 , 先 观察 一 下 该 数据 结构 的 函数 定义 。 
代码 清单 3. 10 ”dalvik/vm/libdex/DexFile. h:DexFieldId 数据 结构 函数 定义 


Struct DexFieldId{ 
2 classTdxy /* 标 示 所 属 类 的 类 型 * / 
ww typeldz; /* 标示 该 字段 类 型 * / 
U4 nameTdxy /* 字段 名 称 * / 


bs 


classIdx 变量 记录 了 字段 所 属 类 的 类 型 ,其 指向 类 型 索引 表 DexTypeld 一 个 表 项 ;变量 
typeldx 记录 了 该 字段 的 类 型 ,其 也 是 指向 类 型 索引 表 DexTypeld 一 个 表 项 ;nameldx 变量 
记录 了 该 字段 的 名 称 , 故 其 指向 字符 串 索 引 表 DexStringId 的 一 个 表 项 。 

DexFieldId 数据 结构 的 大 小 为 8B, 虚 拟 机 可 以 通过 头 文件 中 Field_ids_size 变量 获取 
Dex 文件 中 字段 个 数 , 即 在 field_ids 区 域 中 DexFieldId 结构 体 的 个 数 。 与 其 他 区 域 的 资源 
一 样 ,都 是 采取 对 多 个 数据 结构 进行 排列 的 方式 ,保持 了 高 度 的 规格 化 。 

下 面 是 一 段 Dex 文件 中 字段 索引 信息 的 实例 数据 。 

代码 清单 3. 11 Dex 文件 中 field_ids 字段 索引 资源 实例 

| [0] java. lang.System.out :Ljava/io/PrintStream; 

000134: 0600 | class idx: 0006 

000136: 0200 | type idx: 0002 

000138: 1300 0000 | name idx: 00000013 

从 上 面 数据 的 左 半 部 分 ,可 以 清楚 地 看 到 : 在 这 部 分 数据 中 ,前 两 个 字 节 的 数据 为 
DexFieldId 结构 体 成 员 变 量 classIdx 所 保存 的 内 容 , 即 为 类 型 索引 表 中 某 一 表 项 的 序号 , 往 
后 两 个 字 节 的 数据 为 成 员 变量 typeldx 所 保存 的 内 容 , 即 类 型 索引 表 中 某 一 表 项 的 序号 ,最 
后 4 个 字 节 则 为 成 员 变 量 nameldx 所 保存 的 内 容 , 即 为 字符 串 索引 表 中 某 一 表 项 的 序号 。 


6. method ids 


method ids 资源 区 保存 了 Dex 文件 中 类 方法 数据 的 索引 信息 ,其 采用 数据 结构 
DexMethodId 对 这 部 分 索引 信息 进行 规格 化 ,其 具体 的 函数 定义 如 下 。 
代码 清单 3.12 dalvik/vm/libdex/DexFile. h:DexMethodId 数据 结构 函数 定义 


Struct DexMethodId{ 
2 classIdx; /* 标示 所 属 类 的 类 型 * / 
1 protoldx; /* 标示 方法 原型 类 型 * / 
ud nameldx; /* 方 法 名 称 * / 


ia 


classIdx 变量 记录 了 该 方法 所 属 类 的 类 型 ,其 指向 类 型 索引 表 DexTypeld 一 个 表 项 ; 变 
量 protoldx 记录 了 该 方法 的 原型 ,其 是 指向 原型 索引 表 DexProtold 一 个 表 项 ;nameldx 变 
量 记录 了 该 字段 的 名 称 , 故 其 指向 字符 串 索 引 表 DexStringId 的 一 个 表 项 。 

和 DexFieldId 数据 结构 一 样 ,DexMethodId 的 大 小 也 是 8B, 虚 拟 机 可 以 通过 头 文件 中 
的 Method_ids_size 变量 获取 Dex 文件 方法 数量 . 即 方法 资源 索引 区 中 DexMethodId 数据 
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结构 的 个 数 。 

同样 ,这 部 分 资源 也 是 规格 化 的 ,虚拟 机 可 以 对 其 正确 读 取 。 下 面 从 一 段 真实 Dex 文 
件数 据 的 角度 ,再 次 对 这 部 分 内 容 进行 介绍 ,下 面 是 一 段 类 方法 索引 信息 数据 。 

代码 清单 3. 13 Dex 文件 中 Method_ids 方法 索引 资源 实例 


1 [0] Ioop2.< init> :()V 


00013c: 0100 | class idx: 0001 
00013e: 0300 | proto idx: 0003 
000140: 0100 0000 | name idx: 00000001 
1 [01] Loop2.main: ([Ljava/lang/String;)V 

000144: 0100 | class idx: 0001 
000146: 0500 | proto idx: 0005 
000148: 1200 0000 | name idx: 00000012 
| [2] java.io.Printstream.println: (vjava/lang/String;)V 
O0014c: 0200 | class idx: 0002 
00014e: 0400 | proto idx: 0004 
000150: 1400 0000 | name idx: 00000014 


以 第 一 个 类 方法 Loop2. 一 init 二 为 例 ,我 们 知道 DexMethodId 数据 结构 的 大 小 为 8B， 
通过 观察 上 面 的 数据 段 ,对 于 第 一 个 类 方法 Loop2. 一 init> ,其 类 方法 索引 信息 的 数据 段 起 
始 于 00013c 并 且 终 止 于 000143 ,正好 占据 着 8B 的 内 存 空 间 。 因 此 ,可 以 确定 00013c 和 
00013d 两 个 地 址 中 的 数据 对 应 着 classIdx 变量 所 保存 的 值 , 即 指向 类 型 索引 表 DexTypeld 
一 个 表 项 ,00013e 和 00013f 两 个 地 址 中 的 数据 对 应 着 protoldx 变量 中 所 保存 的 值 , 即 指向 
原型 索引 表 DexProtold 一 个 表 项 以 及 从 000140 开始 以 后 4B 中 所 保存 的 内 容 对 应 着 变量 
nameIdx, 该 值 指向 字符 串 索 引 表 DexStringId 中 的 某 一 表 项 。 


7. class_defs 
在 class_defs 资源 区 中 ,使 用 数据 结构 DexClassDef 对 资源 进行 规格 化 , 先 看 一 下 其 具 
体 的 函数 定义 。 
代码 清单 3.14 dalvik/vm/libdex/DexFile. h:DexClassDef 数据 结构 函数 定义 
Struct DexClassDef{ 
ud classIdx; /* 标示 所 属 类 的 类 型 ,指向 类 型 索引 表 * / 
ud acoessF1agsy /# 访问 标示 符 * / 
u4 superclassIdx; /* 超 类 类 型 ,指向 类 型 索引 表 * / 
ud interfaceoff; /* 接口 信息 ,指向 一 个 Dexrypslist 数 据 结构 实例 * / 
u4 sourosFi ledx; /* 表示 源 文件 名 ,指向 字符 串 索 引 表 * / 
ud classDataOff; /= 类 数据 ,指向 一 个 Dexclasspata 数 据 结构 实例 * / 
ud staticValuesOff; /* 静态 值 偏 移 量 * / 


Bs 

从 上 面 的 DexClassDef 数据 结构 的 函数 定义 中 可 以 发 现 ,该 class_defs 资源 明显 较 之 
前 几 类 资源 在 结构 上 要 复杂 很 多 .在 一 定 程度 上 来 说 ,该 数据 结构 似乎 涵盖 了 一 个 类 所 需 的 
全 部 资源 。 在 这 7 个 成 员 变量 中 ,classDataOff 变量 是 最 重要 的 核心 内 容 , 该 变量 所 记录 的 
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是 一 个 Dex 文件 内 部 地 址 的 偏 移 量 ,该 地 址 指向 一 个 DexClassData 数据 结构 实例 。 先 观察 
一 下 其 函数 定义 。 
代码 清单 3.15 dalvik/vm/libdex/DexClass. h:DexClassData 数据 结构 函数 定义 


Struct DexClassData{ 
DexClassDataHeader header; /* 类 数据 头 * / 
DexField* staticpields; /* 指向 目标 的 静态 字段 * / 
DexFieldx 。 instanceFieldsy /* 指向 目标 类 的 实例 字段 * / 
DesMethod* directMethod; /* 指向 目标 类 直接 方法 * / 
DexMethod* 。 virtualMethod /* 指向 目标 类 直接 方法 * / 


a 


该 数据 结构 的 功能 正如 其 名 称 一 样 ,用 于 记录 目标 类 在 Dex 文件 中 目标 类 数据 ,其 中 
header 变量 用 于 记录 目标 类 各 类 数据 的 概况 ,其 函数 定义 如 下 。 

代码 清单 3. 16 。 dalvik/vm/libdex/DexClass. h: DexClassDataHeader 数据 结构 函数 
定义 


ud staticpieldsSize; /* 记录 静态 字段 的 个 数 * / 
ud intanoeFieldsSize; /* 记录 实例 字段 的 个 数 * / 
ud directMethodsize; /* 记录 直接 方法 的 个 数 * / 
ud virtualMethodsize; /* 记录 虚 方 法 的 个 数 * / 


该 头 部 信息 记录 了 目标 类 中 各 个 部 分 数据 的 个 数 , 主 要 包括 : 静态 字段 ,实例 字段 、 直 
接 方法 以 及 虚 方 法 。 其 中 ,staticFieldsSize 变量 值 加 上 intanceFieldsSize 变量 值 即 为 接 下 
来 DexField 数据 结构 的 数量 ;directMethodSize 变量 值 加 上 virtualMethodSize 变量 值 即 为 
接 下 来 DexMethod 数据 结构 的 数量 。 

DexField 数据 结构 的 函数 定义 如 下 。 

代码 清单 3. 17 dalvik/vm/libdex/DexClass. h:DexField 数据 结构 函数 定义 


ud fieldIdx; /* 指向 字段 索引 表 中 的 一 个 表 项 , 即 一 个 DexFieldra 数 据 结构 * / 
ud acosssFlags; /# 访问 标示 符 * / 


读 到 这 里 ,想必 很 多 读者 都 有 一 个 疑问 ,到 目前 所 介绍 的 数据 结构 似乎 都 是 用 于 对 类 数 
据 的 索引 ,那么 真实 的 Dalvik 字 节 码 究 竟 在 哪儿 ? 接 下 来 就 介绍 一 个 重量 级 成 员 
DexMethod 数据 结构 ,首先 看 下 它 的 函数 定义 。 

代码 清单 3. 18 dalvik/vm/libdex/DexClass. h:DexMethod 数据 结构 函数 定义 


Struct DexMethod{ 
u4methodrdx> /* 指向 方法 索引 表 中 的 一 个 表 项 一 个 DasMethodrd 数 据 结构 * / 
ua acoessFlags; /*#* 访问 标示 符 * / 


ud codeoff; /# 指向 一 个 Dexcoae 数 据 结构 * / 
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通过 DexMethod 数据 结构 ,让 我 们 离 真实 的 字 节 码 数据 又 进 了 一 步 , 前 两 个 变量 较 好 
理解 ,而 codeOff 变量 是 什么 含义 呢 ? 其实,codeOff 正 是 指向 了 一 个 DexCode 数据 结构 ， 
而 该 数据 结构 正 是 用 来 记录 Dex 文件 中 目标 类 方法 字 节 码 ,下 面 让 我 们 一 起 来 揭 开 它 的 面 
纱 。DexCode 数据 结构 函数 定义 如 下 。 

代码 清单 3. 19 dalvik/vm/libdex/DexFile. h:DexCode 数据 结构 函数 定义 


Struct DexCode{ 
u2 registerSize; /* 寄存 器 个 数 * / 
u2 insSize; /* 输入 参数 个 数 * / 
U2 outsSize; /* 外 部 方法 使 用 寄存 器 数 * / 
Ww triessize /x* tries 个 数 */ 
u4 debugInfooff /* 调试 信息 地 址 * / 
u4 insnsSize /* 方 法 指令 个 数 * / 
tu2 insns[insnsSize] /* 真实 指令 数组 * / 


Bs 


Dex 文件 通过 DexCode 数据 结构 管理 类 方法 的 全 部 执行 信息 ,其 中 registerSize 记录 
了 方法 执行 期 间 所 需 的 寄存 器 总 数 ,insSize 记录 了 方法 的 入 口 参 数 的 个 数 ,outsSize 记录 了 
方法 使 用 寄存 器 数 ,triesSize 记录 了 tries 个 数 , debugInfoOff 记录 了 方法 的 调试 信息 ， 
insnsSize 记录 了 方法 字 节 码 数 量 , 即 接 下 来 保存 的 指令 个 数 。 

class_defs 数据 和 前 面 几 类 资源 在 Dex 文件 中 的 存储 方式 相同 ,都 是 以 结构 体 为 单位 
顺序 存储 ,DexClassDef 数据 结构 数据 量 需 占用 28B 的 内 存 空间 ,其 中 每 个 成 员 变 量 占用 
4B 的 内 存 空 间 。 

下 面 是 一 段 Dex 文件 中 实际 的 ClassDef 资源 数据 段 。 

代码 清单 3. 20 ”Dex 文件 中 class_defs 数据 资源 实例 


1 [0] Ioop2 


00017c: 0100 0000 | class idx: 00000001 

000180: 0100 0000 | acoess flags: Public 

000184: 0300 0000 | superclass idx: 00000003 // java.lang.Gbject 
000188: 0000 0000 | interfaoes off: 00000000 

00018c: 0c00 0000 | 。 source file idx: 0000000c // Ioop2.java 
000190: 0000 0000 | annotations off: 00000000 

000194: 3803 0000 | class data off: 00000338 

000198: 0000 0000 | static values off: 00000000 


对 上 面 数据 段 的 左 半 部 分 进行 简单 的 分 析 即 可 得 出 结论 ,在 实际 中 DexClassDef 数据 
结构 也 确实 是 以 源码 定义 的 规则 进行 存储 的 ,有 兴趣 的 读者 可 以 结合 自己 编写 的 Dex 文件 
对 该 数据 结构 的 存储 方式 进行 验证 。 

前 面 介绍 DexClassDef 数据 结构 时 , 曾 提 到 变量 classDataOff 非常 重要 ,在 前 面 的 实际 
数据 段 中 ,该 变量 所 保存 的 数值 为 00000338, 因 此 我 们 直接 定位 到 该 实例 Dex 文件 的 
00000338 字 节 处 ,得 到 如 下 数据 段 。 

代码 清单 3. 21 Dex 文件 中 class data 数据 资源 实例 


| [338] class data for Ioop2 
000338: 00 1 
000339: 00 1 
00033a: 02 1 
00033b: 00 1 
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static fields size: ”00000000 
instance fields size: 00000000 


direct methods size: 00000002 
virtual methods size: 00000000 


首先 看 到 地 址 000338 一 00033b 分 别 存 储 了 目标 类 中 的 静态 字段 .实例 字段 .直接 方法 
以 及 虚 方法 的 数量 。 在 本 例 中 ,静态 方法 的 数量 为 2, 意 味 着 Loop2 类 中 包含 两 个 直接 方 
法 ,下 面 的 数据 段 为 这 两 个 直接 方法 对 应 的 DexMethod 数据 结构 实例 。 

代码 清单 3. 22 ”Dex 文件 中 class method 数据 资源 实例 


1 

1 

1 

1 

000340: 9c03 | 
| 

000342: 01 | 
1 

| 


000344: b403 


direct methods: 
[0] Iocp2.< init> : (0V 


[1] Loop2 .main: ([Ljava/lang/String;)V 
method idx: 00000001 


以 第 一 个 方法 即 Loop2 类 的 构造 方法 的 索引 信息 为 例 ,其 中 第 一 个 字段 为 0, 表示 在 
DexMethodId 表 中 的 第 一 项 , 即 Loop2 的 一 init 二 方法 ;第 二 个 字段 为 8180 04, 表 示 该 方法 
为 一 个 public 类 型 的 构造 函数 ;第 三 个 字段 为 9c03, 经 过 转化 ,该 字段 实际 存储 的 值 为 
0000019c, 该 值 为 Dex 文件 的 内 部 偏 移 地 址 ,其 直接 指向 用 于 描述 该 方法 的 DexCode 数据 
结构 实例 ,我 们 定位 到 地 址 0000019c 处 ,其 数据 段 如 下 。 

代码 清单 3.23 Dex 文件 中 Dalvik 操作 码 数据 资源 实例 


| [19c] Ioop2.< init> : ()V 


1 
1 
1 
1 
1 
1 
1 
O001b2: 0e00 1 
1 
1 
1 
1 
1 
1 


registers size: 0001 


ins_ size: 0001 
outs _ size: 0001 
tries size: 0000 
debug off: (00000326 
insns_size: 00000004 


0000: invoke- direct{v0}, java.lang.Cbject.< init> :()V 
0003: retum- void 
0004: coder adtress 

debug info 

line start: 1 

parameters_ size: 0000 

0000: prologue end 

0000: line 1 

end sequence 


在 上 面 的 例子 中 ,可 以 看 到 从 地 址 00019c 至 0001a7 中 保存 着 目标 方法 在 执行 过 程 中 
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所 使 用 的 寄存 器 个 数 、 输 入 参数 个 数 、tries 个 数 以 及 方法 调试 信息 地 址 等 。 紧 接着 从 地 址 
0001a8 开始 ,Dex 文件 花费 4B 的 存储 空间 保存 了 目标 方法 的 指令 个 数 ,在 本 例 中 insns_ 
size 为 4, 故 在 接 下 来 的 存储 空间 中 将 花费 8B 存储 这 4 条 方法 指令 (每 条 指令 占用 2B 的 内 
存 空间 )。 

在 Dex 文件 中 ,这 4 条 指令 为 7010 0300 0000 0e00, 根 据 上 面 右 侧 的 反 编译 辅助 数据 ， 
可 以 清楚 前 6 个 字 节 的 数据 所 对 应 的 指令 为 invoke-direct {v0), java. lang. Object. 一 init 二 
OV ,该 指令 功能 就 是 对 一 个 类 对 象 实例 进行 初始 化 ,后 面 两 个 字 节 的 数据 所 对 应 的 指令 为 
return-void ,该 指令 表示 函数 返回 。 

至 此 ,完成 了 对 Dex 文件 中 的 一 系列 的 数据 结构 的 介绍 ,并 在 一 个 实际 的 Dex 文件 中 
根据 所 总 结 的 理论 知识 ,成 功 地 追踪 到 了 文件 中 某 一 个 类 中 某 一 个 方法 指令 的 实际 存储 位 
置 ,并 找到 了 用 于 实现 该 方法 的 Dalvik 指令 。 

相信 通过 上 面 的 介绍 ,读者 应 该 对 Dex 文件 的 结构 不 再 陌生 ,而 且 在 一 定 程 度 上 了 解 
了 Dex 文件 中 关键 的 几 类 数据 存储 格式 以 及 各 部 分 数据 的 关联 关系 。 但 作者 仍然 希望 并 
建议 读者 在 学 习 完 本 部 分 知识 后 ,可 以 利用 空 闪 时间 选取 一 个 实例 Dex 文件 ,并 结合 本 书 
所 讲解 的 相关 知识 对 该 Dex 文件 进行 一 次 深入 的 解析 ,这 样 可 以 在 实际 动手 的 过 程 中 加 深 
对 Dex 文件 结构 的 理解 ,升华 所 学 的 知识 。 


3.3 ”Dalvik 字 节 码 介绍 


Dalvik 字 节 码 是 专 为 Dalvik VM 设计 的 一 种 指令 集 , 包 含 在 二 进 制 文件 中 (Dex 文 
件 )。 其 演化 自 Java 字 节 码 ( 存 储 于 class 文件 ) ,是 一 种 “ 跨 平台 ”的 中 间 代 码 , 可 以 在 支持 
Dalvik VM 的 多 重 平台 上 运行 。 和 Java 字 节 码 不 同 的 是 ,Dalvik 字 节 码 是 基于 寄存 器 的 。 
在 实际 操作 中 ,Java 源 程序 首先 需要 编译 成 Java 字 节 码 (class 文件 ) ,再 经 过 dx 工具 转换 
为 Dalvik 字 节 码 。 


3.3.1 Dalvik 字 节 码 总 体 设计 


Dalvik VM 基于 寄存 器 设计 ,Java 字 节 码 转换 为 Dalvik 字 节 码 时 ,方法 调用 栈 已 经 确 
定 , 其 中 明确 指定 使 用 寄存 器 个 数 以 及 额外 的 其 他 数据 ,如 程序 计数 器 PC, 引 用 另外 一 个 
Dex 文件 等 。Dalvik 字 节 码 可 以 使 用 的 虚拟 寄存 器 个 数 可 达 65 536 个 ,每 个 寄存 器 有 
32 位 ,以 相 邻 的 两 个 寄存 器 表示 64 位 的 数据 。 最 终 所 有 的 寄存 器 会 被 映射 到 物理 寄存 器 
上 ,这 将 发 挥 出 RISC 架构 寄存 器 多 的 优势 ,也 是 初期 为 ARM 平台 设计 的 产物 。 

字 节 码 的 操作 码 是 1B, 操 作 数 以 16 位 为 一 个 单元 ,类 、 方 法 或 字符 串 等 常量 以 使 用 常 
量 池 来 引用 。 和 Java 字 节 码 不 同 的 是 ,Dalvik 字 节 码 是 以 小 端 存储 ,并 且 指 令 的 类 型 没有 
限制 。32 位 的 寄存 器 中 可 以 存储 任意 类 型 的 数据 ,如 float 或 int。 其 设计 需要 满足 以 下 几 
个 原则 。 

(1) 参数 顺序 是 : 目的 寄存 器 , 源 寄存 器 。 

(2) 明确 指定 操作 码 类 型 。 如 通用 类 型 的 64 位 操作 码 通常 有 -wide 后 级 ,其 他 有 
-float、-double 等 。 另 外 还 有 些 特殊 后 缀 ,如 move 指令 .在 操作 数 寄存 器 号 用 4 位 表示 时 ， 
指令 是 move vA，vB; 但 在 操作 数 寄 存 器 号 是 用 16 位 表示 时 ,指令 是 move/16 vAAAA， 


vBBBB。 


3.3.2 Dalvik 字 节 码 指令 格式 
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表 3.4 展示 了 部 分 Dalvik 字 节 码 的 指令 格式 。 具 体 查看 Google 官方 文档 。 
表 3.4 Dalvik 字 节 码 指令 格式 


格式 ID 语 法 
CClop 10x Op 
BlAlop 12x Op vA,vB 
AAlop x Op vAA 
10t Op 十 AA 
AAlop BBBB 22x Op vAA，vBBBB 
AAlop CCIBB 23x Op vAA,vBB,vCC 
BlAlop CCCC 22t Op vA,vB, 十 CCCC 
[B=5] op {vyD,vE,vF,vG}, type@CCCC 
[B=5] op {vD,vE,vF}, type@CCCC 
BlAlop CCCC GIFIEID 35c [B=5] op {vD,vE}, type@CCCC 


[B=5] op {vD}, type@CCCC 
[B=5] op {}, type@CCCC 


对 于 表 3.4, 第 一 列 是 指令 格式 ,其 包括 1 至 多 个 单词 ,单词 之 间 以 空格 相隔 ,每 个 单词 
代表 了 16 位 。 单 词 中 的 每 个 字符 代表 4 位 (1 个 单词 最 多 有 4 字符 ) ,字符 以 从 高 至 低 的 顺 
序 读 取 ,同时 加 上 “1” 号 以 便 读 取 。 指 令 中 的 大 写字 母 表 示 在 该 位 置 有 数 或 寄存 器 。*op” 
表明 了 该 位 置 有 8 位 操作 码 以 及 “exop” 表 示 这 是 一 个 扩展 的 16 位 操作 码 。“O0” 则 表明 在 
该 位 置 的 应 该 为 0。 大 多数 情况 下 ,代码 都 是 从 左 到 右 读 取 , 从 低 到 高 在 代码 单元 中 排列 。 
以 指令 格式 “BI|Alop CCCC” 为 例 。 该 指令 由 两 个 16 位 单元 组 成 ,第 一 个 16 位 为 低 8 位 的 
操作 码 和 高 8 位 的 两 个 操作 数 ,第 二 个 16 位 则 是 一 个 16 位 的 操作 数 。 


第 二 列 的 ID 号 是 指令 格式 的 缩写 。 


大 部 分 的 ID 都 有 两 个 数字 及 之 后 的 一 个 字母 组 


成 。 首 个 数字 指明 了 指令 的 长 度 (以 16 位 为 一 个 单位 )。 第 二 个 数字 表示 的 是 指令 最 多 能 
有 多 少 个 寄存 器 (有 些 指 令 的 寄存 器 个 数 是 不 一 定 的 )。 如 果 第 二 位 为 字母 “r”, 则 表示 编码 
了 一 组 寄存 器 。 最 后 一 位 的 字符 指示 了 额外 数据 的 属性 ,详细 说 明 见 表 3. 5。 

表 3.5 额外 数据 属性 说 明 


单 词 位 大 小 含义 
b 8 1 个 字 节 的 有 符号 立即 数 
e 16, 32 常量 池 索 引 
f 16 接口 常量 (只 在 静态 链接 中 使 用 ) 
h 16 32 或 64 有 符号 立即 数 中 的 高 16 位 ,低位 全 为 0 
i 32 有 符号 整 型 立即 数 ,或 者 32 位 的 浮 点 
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续 表 

单 词 位 大 小 含义 

1 64 有 符号 长 整 型 ,或 者 64 位 的 双 精 度 

m 16 方法 常量 ,只 在 静态 链接 中 有 使 用 

n 4 有 符号 4 位 立即 数 

s 16 有 符号 短 整 型 立即 数 

t 8, 16, 32 跳 转 

x 0 没有 额外 的 数据 


比如 ,“21t” 表 示 该 指令 长 为 2(32 位 )、 有 一 个 寄存 器 引用 以 及 包含 一 个 分 支 跳 转 。 

Dalvik 字 节 码 目 前 共有 226 条 指令 ,每 一 条 指令 有 一 个 对 应 的 索引 号 。 在 具体 实现 中 ， 
Dalvik VM 会 维护 一 张 Hash 表 , 以 指令 操作 码 为 索引 。Hash 表 中 的 元 素 是 每 一 条 Dalvik 
字 节 码 指令 相等 价 的 汇编 或 C 语言 实现 。 解 释 器 取 指 后 解码 获得 的 字 节 码 号 就 是 这 个 
作用 。 

以 “move-wide/{rom16 vAA ,vBBBB” 指 令 为 例 : 

(1) move 是 指令 最 基本 的 操作 码 , 说 明了 这 个 指令 的 功能 ; 

(2) wide 是 指令 名 称 后 级 ,说 明 指 令 需 要 操纵 64 位 的 数据 ; 

(3) from16 是 指令 功能 后 缀 ,说 明 源 寄存 器 号 需要 16 位 表示 ; 

(4) vAA 是 目的 寄存 器 ,寄存 器 号 必须 在 v0 一 v255 之 间 ; 

(5) vBBBB 是 源 寄 存 器 ,寄存 器 号 必须 在 v0 一 v65535 之 间 ; 

(6) 该 指令 的 指令 格式 是 22x, 其 长 度 是 两 个 16 位 , 即 4B; 共 使 用 了 两 个 寄存 器 ,并 且 
没有 额外 的 数据 ; 

(7) 指令 字 节 码 号 是 0x05( 根 据 指令 表 ) 。 


3.4 Odex 文件 简介 


Android 设备 在 使 用 的 过 程 中 会 为 目标 程序 生成 一 个 后 缀 为 . odex 的 “优化 文件 ”, 其 
作用 就 是 取代 原 有 的 可 执行 文件 ,以 加 快 程序 的 启动 执行 速度 ,同时 这 些 “ 优 化 文件 "将 永久 
地 保存 在 手机 的 系统 缓存 中 ,但 随 着 使 用 时 间 的 增长 ,手机 内 部 缓存 中 会 产生 大 量 的 “缓冲 
文件 ”, 这 对 于 手机 内 存 容量 较 小 的 用 户 来 说 ,这 些 “ 优 化 文件 ”非但 不 能 提高 手机 的 运行 速 
度 , 甚 至 还 会 使 手机 由 于 内 存 资源 过 低 而 出 现 各 种 问题 。 

因此 ,在 很 多 手机 技术 论坛 上 .有 大 量 的 技术 贴 讲授 如 何 为 手机 “减负 ”, 想 必 有 些 读者 
一 定 有 印象 ,在 多 种 “减负 ”手段 中 ,有 一 招 就 是 删除 系统 内 核 中 data/ dalvik-cache 文件 夹 下 
的 文件 ,在 一 般 情 况 下 都 可 以 释放 出 几 十 兆 字 节 甚至 上 百 兆 字 节 的 内 存 空 间 , 让 手机 一 下 子 
重 获 新 生 。 事 实 上 .所 删除 的 文件 就 是 前 面 提 到 的 “优化 文件 ”但 在 删除 这 些 文件 的 时 候 ， 
我 们 是 否 考虑 过 这 些 文件 都 是 用 来 干什么 的 ? 为 什么 可 以 随意 删除 它们 ? 在 下 面 的 讲解 中 
将 回答 这 些 问 题 。 
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3.4.1 什么 是 “优化 文件 ” 


前 面 讲 到 ,Android 系统 为 了 提高 程序 的 启动 以 及 运行 速度 ,特别 为 目标 应 用 生成 了 与 
之 对 应 的 “优化 文件 ”。 这 些 优 化 文件 正 是 保存 在 前 面 提 到 的 data/ dalvik-cache 文件 夹 中 ， 
它们 就 是 俗称 的 Odex 文件 (Optimized-Dex) ,是 对 Android 应 用 程序 中 所 包含 的 Dex 文件 
在 内 容 上 以 及 结构 上 进行 优化 改写 而 生成 。 在 对 Dex 文件 进行 优化 的 过 程 中 ,主要 对 其 中 
的 类 数据 进行 安全 性 检验 以 保证 其 不 会 威胁 虚拟 机 的 安全 运行 ,以 及 结合 当前 平台 硬件 特 
性 对 程序 源码 进行 优化 以 提高 程序 的 执行 速度 。 


3.4.2 Odex 文件 结构 
直观 上 Odex 文件 在 Dex 文件 的 原 有 的 结构 上 进行 了 扩充 , 即 在 Dex 文件 前 拼接 了 


Odex 文件 头 部 信息 ,还 在 Dex 文件 尾部 拼接 了 依 [ode 文件 结构 | 

赖 库 .寄存 器 映射 关系 以 及 类 的 哈 希 索引 等 辅助 信 “| Dex 文 件 结构 Odex 文 件 头 部 

息 。 其 结构 对 比如 图 3. 3 所 示 。 Dex 文 件 头 部 | 原 Dex 文 件 
下 面 再 通过 Odex 文件 的 头 部 信息 可 以 更 好 ”| 内 部 数据 索引 

地 了 解 一 下 Odex 的 文件 结构 以 及 各 部 分 数据 含 |Dex 文 件数 据 区 依赖 库 信息 

义 , 表 3.6 为 Odex 文件 头 DexOptHeader 在 Dexfile. 辅助 信息 

h 文件 中 的 定义 。 图 3.3 ”Dex 文件 与 Odex 文件 结构 对 比 图 


表 3.6 DexOptHeader 数据 结构 定义 


变量 类 型 变量 名 称 描 述 
ul Magic[8] Odex 文件 版 本 标识 
ud dexOffset Dex 文件 头 偏 移 量 
ud dexLength Dex 文件 总 长 度 
ud depsOffset Odex 文件 依赖 库 列表 偏 移 量 
ud depsLength 依赖 库 信息 总 长 度 
ud optOffset 优化 数据 信息 偏 移 量 
u4 optLength 优化 数据 总 长 度 
ud flags 标识 位 
ud checksum 文件 校 验 和 


表 3.6 中 ,DexOptHeader 结构 中 的 magic 字段 与 DexHeader 结构 中 的 magic 字段 类 
似 ,都 是 用 于 标识 文件 ;dexOffset 字段 表示 原 Dex 文件 起 始 位 置 的 偏 移 量 , 实 际 上 它 就 等 
于 DexOptHeader 结构 体 的 大 小 0x28; dexLength 字段 表示 Dex 文件 的 总 长 度 ,通过 这 两 
个 字段 可 以 非常 快速 定位 并 读 取 Dex 文件 ; depsOffset 字段 表示 依赖 库 起 始 的 偏 移 量 ; 
depsLength 表示 依赖 库 的 总 长 度 ;optOffset 字段 表示 优化 数据 的 起 始 偏 移 量 ;optLength 
字段 表示 优化 信息 的 总 长 度 ,而 对 于 类 加 载 机 制 非常 关键 的 类 索引 信息 就 封装 在 这 部 分 优 
化 信息 中 ;flags 字段 为 一 个 标识 ,其 用 于 标示 Dalvik 虚拟 机 加 载 Odex 文件 时 优化 与 验证 
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选项 ;checksum 字段 为 Odex 文件 的 校 验 和 。 
通过 这 个 头 部 信息 ,虚拟 机 可 以 非常 高 效 地 查找 Dex 文件 中 的 各 类 信息 , 极 大 提高 了 
执行 效率 。 另 外 ,Dalvik 虚拟 机 对 Dex 文件 所 进行 的 优化 工作 主要 体现 在 依赖 库 和 辅助 信 


息 两 部 分 上 ,因此 ,下 文 将 会 对 这 两 部 分 内 容 的 功能 进行 介绍 。 


1. 依赖 库 信息 


依赖 库 顾 名 思 义 ,就 是 指 该 Dex 文件 所 需要 链接 的 本 地 函数 库 , Dalvik 虚拟 机 在 程序 
执行 前 期 通过 优化 机 制 将 这 部 分 整合 到 Odex 文件 中 ,可 以 在 一 定 程 度 上 提高 程序 的 执行 
效率 , 表 3. 7 为 依赖 库 Dependence 结构 体 定义 。 


表 3.7 Dependence 数据 结构 定义 


变量 类 型 变量 名 称 描 述 
ud modWhen 时 间 截 
ud ere 校 验 信息 
ud4 DALVIK_VM_BUILD 虚拟 机 版 本 号 
ud numDeps 依赖 库 个 数 
u4 len Name 长 度 
ud name[len] 依赖 库 名称 
KSHA1DigestLen signature SHA-1 值 


在 表 3.7 中 ,modWhen 用 来 记录 Dex 文件 优化 前 的 时 间 戳 ,crc 为 Dex 文件 优化 前 的 
crc 校 验 值 ,DALVIK_VM_BUILD 值 表示 的 是 虚拟 机 版 本 号 ;不 同 版 本 的 Android 系统 定 
义 不 同 ,例如 : Android 2. 2. 3 为 19、Android 2. 3 为 23 以 及 Android 4. 0. 4 则 为 27。 
numDeps 字段 所 代表 的 含义 为 该 Dex 文件 的 依赖 库 个 数 ,其 中 table 结构 体 的 个 数 正 是 由 
numDeps 决定 的 ,也 可 以 理解 为 每 个 依赖 库 都 对 应 一 个 table 结构 体 对 象 ,在 该 结构 体 中 ， 
len 表示 依赖 库 名 称 的 长 度 、name 为 依赖 库 名 以 及 signature 表示 SHA-1 签名 。 


2. 类 索引 信息 


类 索引 信息 的 建立 是 优化 机 制 的 重要 工作 之 一 ,在 该 索引 表 中 ,优化 机 制 为 Dex 文件 
中 的 每 一 个 类 配置 了 一 个 table 结构 体 对 象 , 在 这 个 对 象 中 记录 了 类 描述 符 哈 希 值 、 类 描述 
符 在 Dex 文件 中 偏 移 地 址 以 及 类 定义 区 的 偏 移 地 址 ,类 加 载 机 制 通过 这 些 信息 可 以 非常 快 
速 地 定位 类 资源 地 址 并 加 载 类 。 同 时 ,通过 哈 希 查找 的 方式 大 大 提高 了 类 加 载 机制 的 查找 
效率 , 表 3. 8 为 DexClassLookup 结构 体 定义 。 

表 3.8 中 ,numEntries 是 一 个 比较 特别 的 数目 , 它 虽 然 表 示 的 是 表 的 项 数 ,但 实际 上 这 
个 数值 是 通过 dexRoundUpPower2() 函 数 生成 的 。 

点 拨 dexRoundUpPower2() 函数 是 源 自 斯 坦 福 大 学 的 一 个 算法 一 一 用 于 求 比 一 个 数 
大 的 最 小 的 2 的 整数 次 紧 , 例 如 , 当 数 为 6 时 ,该 算法 计算 得 到 8。 这 样 做 的 结果 会 比 Dex 
文件 中 类 的 数量 大 ,但 好 处 是 降低 了 哈 希 冲突 率 。 
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表 3.8 DexClassLookup 数据 结构 定义 


变量 类 型 变量 名 称 描 述 
int size 表 大 小 
int numEntries 表 项 入 口 数量 
ud classDescriptorHash 类 描述 符 的 哈 希 值 
ud classDescriptorOffset Dex 文 件 中 该 类 描述 符 的 偏 移 位 置 
ud classDefOffset Dex 文件 中 该 类 定义 偏 移 位 置 


3.4.3 Odex 文件 加 速 系统 运行 速度 


熟悉 Java 语言 的 读者 应 该 知道 ,标准 的 Java 虚拟 机 在 执行 一 个 应 用 程序 前 ,会 对 程序 
中 的 类 数据 进行 验证 并 优化 ,但 是 这 种 标准 的 验证 优化 机 制 并 不 会 对 程序 源码 数据 造成 永 
久 性 改变 。 因 此 ,标准 的 Java 虚拟 机 每 每 在 执行 程序 之 前 都 要 反复 做 这 项 工作 ,在 效率 上 
有 一 定 损失 ,但 是 鉴于 大 多 数 的 Java 虚拟 机 都 是 运行 在 PC 之 上 ,而 当今 PC 的 性 能 又 都 普 
遍 较 高 ,在 效率 上 的 这 点 损失 就 显得 微不足道 了 。 但 是 ,我 们 都 知道 Android 系统 主要 是 运 
行 在 我 们 熟悉 的 各 类 移动 设备 之 上 ,例如 : 平板 电脑 .手机 .GPS 导航 设备 等 ,而 移动 设备 往 
往 具有 处 理 器 计算 能 力 低 下 以 及 内 存 资源 紧张 等 硬件 限制 ,其 整体 性 能 远 不 及 当今 家 用 
PC, 想 要 在 嵌入 式 设备 上 流畅 运行 标准 Java 虚拟 机 几乎 是 一 件 不 可 能 的 事情 。 因 此 ， 
Dalvik 虚拟 机 的 开发 者 通过 使 用 多 种 手段 以 提高 程序 运行 速度 ,并 减少 不 必要 的 操作 ,不 
但 完全 兼容 标准 Java 语言 ,而 且 还 尽 可 能 地 保证 了 用 户 使 用 感受 。 

在 多 种 用 于 提高 程序 执行 效率 的 手段 中 ,将 应 用 程序 数据 验证 与 优化 工作 的 前 置 是 
Dalvik 虚拟 机 功能 架构 设计 上 的 一 个 创新 ,是 区 别 于 其 他 Java 虚拟 机 的 重要 特点 之 一 。 前 
面 提 到 ,虚拟 机 在 运行 目标 程序 之 前 需要 对 其 中 的 数据 进行 验证 优化 ,随后 再 对 优化 过 的 数 
据 进行 执行 。 但 是 对 于 运行 Android 系统 的 嵌入 式 设备 来 说 ,大 量 的 验证 与 优化 工作 可 能 
会 对 系统 造成 沉重 的 负担 ,那么 有 什么 办 法 可 以 避免 重复 多 次 地 对 程序 数据 进行 验证 优化 
呢 ? 最 为 直接 的 办 法 就 是 长 期 保留 目标 程序 的 优化 数据 ,而 我 们 经 常 提 及 的 Odex 文件 实 
际 上 就 是 用 来 保存 这 些 优化 数据 ,这 样 做 的 好 处 是 当 程 序 再 次 运行 时 ,系统 将 首先 判断 目标 
程序 是 否 存在 对 应 的 Odex 文件 ,如 果 存 在 将 跳 过 验证 与 优化 这 一 步 ,直接 运行 Odex 文件 
中 的 数据 。 这 就 是 为 什么 在 Android 系统 中 ,程序 第 一 次 启动 的 时 间 相 对 较 长 ,而 多 出 来 的 
这 部 分 时 间 正 是 用 来 为 目标 程序 生成 与 之 对 应 的 Odex 文件 并 将 该 文件 保存 在 cache 中 ,大 
大 降低 了 程序 再 次 启动 的 时 间 与 性 能 消耗 。 

关于 Dex 文件 验证 优化 机 制 的 技术 原理 以 及 相关 的 实现 细节 ,请 参阅 本 系列 丛书 第 二 
卷 第 1 章 。 


3.4.4 手机 “减负 ”问题 再 讨论 


再 回 到 为 手机 “减负 ”的 问题 上 ,简单 讨论 一 下 cache 中 的 Odex 文件 到 底 值 不 值得 删 
除 。 在 理论 上 .删除 Odex 文件 不 会 造成 任何 的 系统 故障 ,其 唯一 可 能 的 影响 就 是 : 由 于 缺 
失 对 应 的 Odex 文件 ,虚拟 机 将 会 再 一 次 对 程序 进行 优化 并 为 之 生成 对 应 的 Odex 文件。 说 
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到 这 里 ,不 禁 有 读者 要 问 , 这 样 做 似乎 没有 任何 好 处 啊 ! 即 便 删 掉 了 Odex 文件 ,但 是 虚拟 机 
仍然 还 会 再 次 生成 ,不 仅 没有 达到 节省 资源 的 目的 ,而 且 又 一 次 损失 了 时 间 ( 用 于 再 次 对 
Dex 文件 进行 验证 与 优化 ) ,实在 得 不 偿 失 。 

其 实 可 以 换个 角度 来 看 待 这 个 问题 ,想必 很 多 读者 的 手机 中 或 多 或 少 都 安装 了 各 类 应 
用 ,出 于 各 种 原因 ,其 中 的 部 分 应 用 会 被 用 户 印 载 删除 ,但 是 这 些 被 卸载 的 应 用 程序 所 对 应 
的 Odex 文件 有 可 能 没有 被 删除 ,仍然 保存 在 cache 中 占据 着 设备 那 可 怜 的 内 存 资源 。 因 
此 ,对 于 这 类 Odex 文 件 ,应 该 坚决 把 它们 删除 ,收复 它们 占用 的 内 存 , 这 样 不 就 真 的 做 到 了 
“减负 ”的 目的 了 么 。 总 结 来 说 ,就 Odex 文件 的 删除 原则 来 说 主要 归纳 为 以 下 三 点 : 

(1) 对 于 常用 的 应 用 ,其 对 应 的 Odex 文件 不 能 被 删除 。 

(2) 对 于 不 太 常 用 的 应 用 但 又 不 准备 印 载 ,可 以 选择 删除 所 对 应 的 Odex 文件 。 

(3) 对 于 已 经 被 卸载 的 应 用 ,其 对 应 的 Odex 文件 要 坚决 删除 毫 不 姑息 。 

Odex 文件 的 开发 与 设置 ,实际 上 是 对 设备 存储 空间 的 一 种 牺牲 ,而 这 种 牺牲 却 换 取 了 
更 好 的 计算 性 能 ,使 用 户 的 使 用 感受 得 到 显著 提高 。 依 据 前 面 提 到 的 三 点 建议 ,相信 读者 们 
都 能 或 多 或 少 地 回收 一 些 宝 贵 的 内 存 资源 ,然而 随 着 应 用 软件 的 高 速 发 展 ,对 设备 的 性 能 以 
及 资源 的 需求 越 来 越 大 ,在 此 只 能 盼望 硬件 快速 发 展 , 早 日 摆脱 硬件 带 来 的 局 限 。 


小 结 


Dex 文件 作为 Android 系统 的 可 执行 文件 ,封装 了 应 用 程序 的 全 部 操作 指令 以 及 程序 
数据 ,其 于 Dalvik 虚拟 机 的 重要 性 不 言 而 喻 。 本 章 主要 对 Dex 文件 中 所 涉及 的 各 个 数据 结 
构 的 函数 定义 进行 了 分 析 并 结合 一 个 Dex 文件 实例 进行 讲解 ,同时 还 对 Dalvik 字 节 码 进行 
了 全 面 的 介绍 ,主要 包括 字 节 码 设 计 、 字 节 码 格式 等 内 容 。 最 后 ,本 章 对 Dex 文件 的 优化 产 
物 Odex 文件 功能 原理 与 实际 应 用 进行 了 简单 的 介绍 。 希 望 读者 通过 本 章 的 学 习 能 够 对 
Dex 文件 有 了 一 个 更 深层 次 的 认识 。 


D+1+€@ 
系统 工具 


本 章 主要 内 容 

名 如 何 对 Dex 文件 进行 反 编译 ? 

名 Dex 文件 及 apk 对 系统 包 系 统 类 及 系统 函数 存在 着 怎样 的 依赖 ? 

dexlist 工具 是 怎样 获取 并 列举 类 中 的 方法 的 ? 

名 Dex 文件 是 如 何 实现 优化 和 验证 的 ? 

如 以 dvz 的 方式 启动 一 个 进程 如 何 实现 ? 

在 Dalvik 虚拟 机 中 存在 着 大 量 的 系统 工具 ,完成 虚拟 机 相关 系统 操作 的 同时 ,用 户 也 
可 以 利用 这 些 工具 分 析 虚 拟 机 内 部 机 制 ,Dex 文件 作为 虚拟 机 运行 过 程 中 的 一 个 核心 文件 ， 
分 析 理 解 Dex 文件 对 于 认识 虚拟 机 内 部 机 制 , 提 高 虚拟 机 中 程序 的 运行 速度 有 很 大 帮助 。 
此 外 ,一 些 源码 分 析 工 具 也 帮助 程序 员 解 决 一 些 调试 过 程 中 刺 手 的 问题 ,熟练 运用 工具 解决 
编码 中 出 现 的 一 些 内 存 泄漏 及 堆栈 溢出 的 问题 也 十 分 有 效 。 


4.1 本 章 概述 


对 于 操作 系统 来 说 ,除了 平时 使 用 的 功能 以 外 ,都 有 可 供用 户 使 用 的 工具 ,丰富 系统 的 
功能 ,同时 也 可 以 由 用 户 完成 对 系统 内 核 的 一 些 分 析 操 作 。 在 Dalvik 虚拟 机 中 也 有 很 多 工 
具 , 你 了 解 它们 的 功能 吗 ? 为 了 更 好 地 理解 Dalvik 虚拟 机 附带 的 工具 ,了 解 系统 工具 完成 
的 功能 。 在 第 3 章 对 Dex 文件 进行 介绍 的 基础 上 ,本 章 结合 Dalvik 的 系统 工具 ,围绕 Dex 
文件 的 相关 操作 展开 .使 用 Dalvik 中 的 系统 工具 对 Dex 文件 进行 分 析 ,提炼 Dex 文件 中 包 
含 的 信息 ,进行 相关 的 优化 ,分 析 Dex 文件 运行 所 依赖 的 相关 配置 ,能 够 很 好 地 完成 对 
Dalvik 中 内 部 机 制 的 理解 。 此 外 ,系统 工具 还 提供 了 对 Android 程序 源码 进行 调试 的 功能 ， 
可 以 有 效 地 提高 程序 运行 的 效率 。 

本 章 主 要 介绍 Dex 文件 的 逆向 工具 ,dexdump 工具 主要 完成 对 Android 程序 的 反 编 
译 ,用 于 逆向 分 析 在 apk 程序 生成 过 程 中 的 Dex 文件 。dexdeps 工具 是 Dex 文件 的 依赖 工 
具 , 分 析 程 序 使 用 的 依赖 包 信息 。dexlist 工具 列 出 一 个 Dex 文件 中 所 有 具体 类 中 的 所 有 方 
法 ;Dex 文件 优化 工具 dexopt 主要 完成 对 Dex 文件 进行 优化 ,提高 文件 的 载 和 速度。 此 外 ， 
启动 进程 的 dvz 工具 完成 对 进程 启动 。 
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4.2 dexdump 工具 


4.2.1 dexdump 工具 简介 


道 向 工程 作为 现在 一 个 比较 热门 的 领域 ,针对 不 同类 型 的 程序 的 逆向 工具 也 很 多 ,很 多 
也 非常 成 熟 ,dexdump 作为 一 个 Android 平台 下 的 反 编译 工具 ,用 于 获取 文件 的 检验 和 、 文 
件 摘 要 文件 头 信息 、 布 局 .寄存 器 映射 等 信息 ,通过 对 生成 的 文件 进行 分 析 , 可 以 得 到 
Android 程序 源码 中 的 一 些 信息 ,在 源码 未 知 的 情况 下 ,在 知道 功能 同时 可 以 对 目标 程序 进 
行 分 析 , 同 时 这 也 带 来 了 代码 不 安全 的 问题 ,程序 的 漏洞 被 利用 这 样 一 个 信息 安全 问题 ,使 
用 这 个 工具 也 可 以 对 自己 的 程序 的 安全 性 进行 分 析 和 验证 。 将 已 经 打包 完成 的 apk 程序 解 
压 , 分 析 包 中 的 Dex 文件 ,Dex 文件 相关 内 容 已 在 3. 2 节 进 行 了 介绍 。 对 Dex 文件 进行 反 
编译 ,得 到 程序 代码 的 相关 信息 便于 分 析 。dexdump 工具 的 源码 位 置 位 于 Android_dalvik_ 
source\dexdump ,读者 有 兴趣 可 以 参阅 学 习 。 


4.2.2 dexdump 工具 使 用 方法 


dexdump 工具 作为 一 个 Android 平台 下 的 反 编译 工具 ,其 源 文件 是 Dex 文件 ,Dex 文 
件 存 在 于 apk 安装 包 中 。 对 apk 文件 进行 处 理 ,apk 文件 是 Android 程序 打包 后 的 安装 程 
序 , 在 安装 了 Android SDK 开发 包 的 Eclipse 开发 环境 下 可 以 很 方便 将 程序 打包 。 解 压缩 
apk 文件 后 ,得 到 待 分 析 的 Dex 文件 。 

其 中 文件 后 级 为 dex 的 即 为 所 需 的 Dex 文件 ,其 他 文件 如 AndroidMainfest. xml 为 主 
体 框架 的 配置 文件 。 

本 节 将 介绍 两 种 使 用 dexdump 工具 反 编译 Dex 文件 的 方法 ,一 种 是 不 启动 Android 模 
拟 器 直接 对 Dex 文件 进行 反 编译 , 另 一 种 方法 是 启动 Android 模拟 器 反 编 译 Dex 文件 。 

第 一 种 方法 ,直接 在 命令 行 界面 下 调用 dexdump 工具 对 目标 dex 文件 进行 反 编 译 ,无 
须 启 动 Android 模拟 器 ,具体 的 实现 步骤 如 下 。 

第 一 步 : 配置 Android 模拟 器 相关 的 环境 变量 

使 用 的 操作 系统 为 Ubuntu 10. 04, 通 过 之 前 几 章 的 介绍 相信 读者 已 经 对 Linux 操作 系 
统 下 的 相关 操作 有 了 一 定 的 了 解 , 相 关 的 命令 行 操作 可 通过 Ctrl 十 Alt 十 T 启动 终端 来 完 
成 ,首先 ,通过 调用 cd 命令 完成 进入 源码 目标 路 径 的 转换 。 本 例 中 Android 源码 所 在 的 文 
件 目录 为 Androidsource/Android4. 04 ,相关 的 配置 过 程 如 图 4. 1 所 示 ,配置 环境 变量 的 主 
要 命令 如 下 : 

build/envsetup.sh 

lunch 1 

第 二 步 : 调用 dexdump 命令 对 Dex 文件 进行 反 编 译 

以 dexdump 的 -d 参数 进行 反 编译 为 例 . 源 Dex 文件 为 fibo. dex, 存 放 在 dextest 文件 夹 
下 ,输出 文件 为 classtest. txt, 调用 命令 dexdump -d fibo. dex 二 classtest. txt, 其 中 
classtest. txt 为 反 编译 后 的 输出 文件 ,获得 输出 文件 的 代码 块 的 信息 ,核心 反 编译 命令 : 
dexdump -d fibo. dex 二 classtest. txt, 相 关 的 命令 执行 过 程 如 图 4. 2 所 示 。 


androidsource/android4.0.4 


cheng@cheng- Lapto cd androidsource 
cheng@cheng-laptop:~/androidsource$s cd android4.6.4 
cheng@cheng-laptop:~/androidsource/android4.0.45 . build/envsetup.sh 
including device/moto/stingray/vendorsetup.sh 

including device/moto/wingray/vendorsetup.sh 

including device/samsung/crespo4g/vendorsetup.sh 
including device/samsung/crespo/vendorsetup.sh 
including device/samsung/maguro/vendorsetup. sh 
including device/samsung/torospr/vendorsetup.sh 
including device/samsung/toro/vendorsetup. sh 

including device/samsung/tuna/vendorsetup.sh 

including device/ti/panda/vendorsetup.sh 

including sdk/bash completion/adb.bash 
cheng@cheng-laptop:~/androidsource/android4.0.4$ lunch 1 


TARGET 
TARGET BUILD VARIANT=eng 
TARGET_BUILD TYPE=release 
BUILD _APP: 
ARCH=arm 
ARCH VARIANT=armv7-a 


图 4.1 配置 模拟 器 启动 的 环境 变量 


外 信介 cheng@cheng-laptol 


including device/ti/panda/vendorsetup. sh 
including sdk/bash_completion/adb.bash 
androidsource/android4.6.4S Lunch 1 


PLATFORM _VERSION_CODENAMI 
PLATFORM VERSION=4.0.4 
PRODUCT=full 
BUILD_VARIAN 
BUILD TYP 
BUILD_APP: 
ARCH=arm 
ARCH_VARIANT=armv7-a 


HOST_0S=linux 


HOST_BUILD TYPE=release 
BUILD ID=IMM76L 


cheng@cheng-laptop:~/androidsource/android4.0.4$ cd .. 


图 4.2 执行 dexdump 命令 对 Dex 文件 进行 反 编译 


其 中 ,-d 操作 对 代码 进行 拆 分 操作 ,-c 操作 对 校 验 和 进行 检验 操作 。-c.-f,-h 操作 与 -d 
的 效果 类 似 。 关 于 dexdump 反 编 译 中 使 用 的 命令 和 相关 参数 以 及 其 具体 含义 


dexdimp: [-c] Cd Cf hb] Ci] C1 layout] -m Ct tempfile] dexfile 
-c : verify dhecksum and exit 
-d : disassenble code sections 
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—£ : display summary infommaticn from file header 
-h : display file header details 

-i : ignore checksum failures 

—1 : output layout, either ‘plain' or "ml 

—m : dnp register maps (and nothing else) 

-tt : temp file name (defaults to /sdcard/dex— temp- * ) 


作者 总 结 出 来 的 使 用 中 方便 记忆 相关 操作 命令 的 方法 ,如 表 4. 1 所 示 。 
表 4.1 dexdump 工具 反 编译 命令 


命 令 功能 及 记忆 方法 
检查 检验 和 并 退出 ,checksum 首 字母 c 
-d 拆 分 代码 区 域 , disassemble 首 字 母 d 
{ 从 文件 头 中 显示 的 摘要 信息 ,file 首 字母 f 
-h 显示 文件 头 的 详细 信息 ,header 首 字母 h 


-i 忽略 检验 和 失败 ,ingore 首 字母 i 


-1 输出 布局 以 plain 或 者 xml 形式 ,layout 首 字母 1 


-m 转 储 寄存 器 映射 ,maps 首 字母 m 


第 三 步 : 分 析 反 编译 生成 的 文件 
生成 fibo. dex 文件 的 Java 程序 源 文件 Fibonacci. java 如 代码 清单 4. 1 所 示 。 
代码 清单 4.1 手动 编写 Fibonacci. java 源 代码 
jimport java. lang.System; 
Public class Fibonacci { 

private long fib java (int mum) 

{ 

if (mm==0){ 
retumn numy 


retum fib java oum 1)+ fib java (nm 2); 
于 
piblic static void main (String args[]) 


Fibonacci fib= new Fibonacci (); 
fib.fib java (35); 
System.out. .print in ("test Fibonacci"); 
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源 文件 Fibonacci. java 主要 完成 在 自 定 义 函 数 中 计算 斐 波 那 契 数列 的 功能 。 在 主 函 数 
中 完成 实例 化 Fibonacci 类 的 一 个 对 象 ,并 调用 非 波 那 契 数 列 的 计算 函数 ,完成 相关 功能 ,最 
后 打印 出 “test Fibonacci”。 

在 第 二 步 中 对 fibo. dex 进行 反 编 译 ,使 用 dexdump 一 d fibo. dex 二 classtest. txt 命 
令 , 得 到 classtest. txt 文件 ,如 代码 清单 4. 2 所 示 。 

代码 清单 4.2 反 编 译 结果 classtest. txt 代码 


Processing "fibo.dex'… 
OPened 'fibo.dex', dex version "035" 


Class #0 - 
Class descriptor : "LFibonacci;" 
Recess flags : 0x0001 (FUELIC) 
Superclass : ‘Ljava/lang/Object;" 
JInterfaces 一 
Static fields - 
Jnstance fields 
Direct methods 一 
#0 : (in IFibonacci;) 
name Se i 
type 守明 而 
access : 0xl0001 (EUBLIC COCNSTRUCTCR) 
pe 四 
registers dL 
ins 入 outs 
insns size : 4 16- bit code units 
00015c: | [00015c] Fibonacci.< init> : 0V 
00016c: 7010 0400 0000 10000: invoke- direct {v0}, Ljava/lang/Cbject;.< init> : ()V / method 
@ 0004 
000172: 0e00 10003: retum- void 
Catches (none) 
Eositions 
Qx0000 line=2 
Iocals 


#1 (in IFibonacci;) 
name 'fib java' 
type "(DT 
access 0x0002 (PRIVATE) 
Ed 一 
registers :6 
ins g 
outs :2 
insns size : 20 16-bit code units 


000174: | [000174] Fibonacci.fib java: (I)J 
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000184: 3905 0400 10000: if- nez v5, 0004 // + 0004 
000188: 8150 10002: int- tor long wo, v5 
00018a: 100010003: retum- wide vo 
00018c: 1210 10004: const/4 vO, # int 1 // #1 
00018e: 9100 0500 10005: sub- int v0, v5, WO 
000192: 7020 0100 0400 10007: invoke— direct {v4, vo}, IFibonacci; .fib java: (T)J // methode 0001 
000198: 0b00 1000a: move- Iesult- wide vO 
00019a: 1222 1000b: const/4 v2, # int 2 // #2 
00019c: 9102 0502 1000c: sub- int va, w, V2 
O001a0: 7020 0100 2400 1000e: invoke- direct {v4, v2}, IFibanacci; .fib java: (T)J // methode 0001 
O0001a6: 0b02 10011: move- result— wide V2 
0001a8: Hb20 10012: add- long/2addr vo, v2 
000laa: 28f0 10013: goto 0003 // - 0010 
catches : (none) 
Fositions 
Qx0000 line=5 
Qx0002 line= 6 
0x0003 line= 10 
locals : 


0x0000 — 0x0014 reg= 4 this LFibonacci; 


#2 : (in IFibonacci;) 

Neme : "main'" 

Type : '([java/lang/String;)V' 

RPRccess : 0x0009 (FUBLIC STATIC) 

code 名 

Registers “3 

Ins :1 

Outs :2 

insns size : 18 16- bit code nits 
O00lac: | [0001ac] Fibonacci main: ([Ljava/lang/String;)V 
O00lbc: 2200 0200 10000: newr instance vO, IFibonacci; // type@ 0002 
0001c0: 7010 0000 0000 10002: invoke— direct {vO}, IFibonacci; .< init> :()V 
// method8 0000 
O001c6: 1301 2300 10005: const/16 v1, # int 35 // #23 
O001ca: 7020 0100 1000 10007: invoke— direct {vO, v1}, IFibonacci; .fib java: (I)J // method8 0001 
0001d0: 6200 0000 1000a: sget- dbject vO, Ljava/lang/System; .out:Ljava/ 
io/PrintStream; // fielde 0000 
000194: la01 1100 1000c: const- string vl, "test Fibonacci" // stringe 0011 
000198: 6e20 0300 1000 1000e: invoke- virtual {vO, vi}, Ljava/io/PrintStream; 
-println: (Ljava/lang/String;)V // methode 0003 
O0019e: 0e00 10011: retum- void 

Catches : cne) 

Eositions 


Virtual methods = 
source file idx 


: 1 (Fibonacci.java) 
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点 拨 输出 的 txt 文件 可 能 比较 大 ,建议 使 用 Vim 打开 ,以 免 在 分 析 时 出 现 程序 没有 响 


应 的 情况 。 


反 编 译 生成 的 文件 中 类 描述 中 体现 了 类 的 名 字 Fibonacci, 访 问 标 志 是 public 的 , 紧 接 
着 #0 开始 是 Fibonacci 的 一 个 初始 化 函数 ,展现 了 寄存 器 的 数量 为 1, 输 入 输出 的 数量 均 为 


1 ,指令 集 大 小 为 4 个 16 位 的 代码 单元 。 


#1 开始 是 Fibonacci 类 中 的 另外 一 个 函数 fib java, 是 private 的 。 对 应 的 代码 段 


如 下 : 


000174: 

000184: 3905 0400 

000188: 8150 

00018a: 1000 

00018c: 1210 

00018e: 9100 0500 

000192: 7020 0100 0400 
TFibonacci; .fib java: (I)J // methode 0001 
000198: 0b00 

00019a: 1222 

00019c: 9102 0502 

0001a0: 7020 0100 2400 

TIFibonacci; .fib java: (I)J // methode 0001 
0001a6: 0b02 

0001a8: bb20 

000laa: 28f0 


| [000174] Fibonacci.fib java: (I)J 


10000: 
10002: 
10003: 
10004: 
10005: 
10007: 


1000a: 
1000b: 
1000c: 
1000e: 


10011: 
10012: 
10013: 


if- nez v5, 0004 // + 0004 
int- to- long v0, 号 
retum- wide vO 
Const/4 vO, #int 1 // #1 
stb- int vO, v5, wo 
invoke— direct {v4, vO}, 


move- result— wide vO 
const/4 v2, #int 2 // #2 
Subr int v2, v5, V2 
irvoke— direct {v4, v2}, 


move- result— wide v2 
addL long/2addir vO, v2 
gpto 0003 // - 0010 


将 源 文件 和 反 编译 后 的 文件 进行 对 比分 析 . 上 述 代码 分 别 执行 的 是 源 代码 中 的 第 5,6， 
10 行 代码 的 内 容 。 其 完成 的 功能 是 对 数值 的 判断 ,根据 不 同 结果 返回 。 


0001d0: 6200 0000 
.out:Ijava/io/Printstream; // fielde 0000 
000194: la01 1100 

// stringe 0011 


1000a: sget— dbject WO, Ljava/lang/System 


1000c: 


const- string v1, "test Fibonacci" 


不 难看 出 上 述 代 码 完 成 的 是 一 个 打印 语句 的 操作 ,调用 java/lang/System;. out: 
Lijava/io/PrintStream 包 里 的 打印 输出 流 函 数 完成 对 “test Fibonacci” 语 句 的 打印 ,在 源码 中 
对 应 的 语句 是 System. out. println("test Fibonacci"); 

“0001de: 0e00 0011: return-void” 在 程序 的 第 20 行 大 括号 结束 ,返回 出 数值 ,类 型 为 
void。 而 代码 中 的 第 18 行 和 19 行为 空白 行 ,在 反 编译 过 程 中 未 产生 任何 内 容 。 
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上 述 代 码 中 获得 的 是 类 的 头 信息 ,类 的 描述 ,访问 标志 , 超 类 ,接口 ,静态 数据 ,实例 数 
据 , 直 接 方法 , 虚 方 法 。 

类 似 地 ,可 以 调用 反 编 译 Dex 文件 校 验 和 操作 ,并 进行 分 析 , 调 用 dexdump 一 f fibo. 
dex 二 filesummary. txt 将 生成 文件 摘要 信息 ,由 于 篇 幅 原 因 , 只 选取 其 中 一 部 分 进行 分 析 ， 
选取 摘要 文件 filesummary. txt 的 一 部 分 进行 分 析 。 相 关 反 编译 代码 如 代码 清单 4. 3 所 示 。 

代码 清单 4.3 反 编 译 部 分 代码 

dex file header: 


Magic : "dex\n035\0' 
Checksum : 01987660 
Signature : 3b4..2957 
file size : 908 
header size : 112 
link size :0 
link off : 0 (0x000000) 
string ids size :18 
string ids off : 112 (0x000070) 
type ids size » 
type ids off : 184 (Ox0000b8) 
field ids size :1 
field ids off : 268 (0x00010c) 
method ids size :5 
method ids off : 276 (0x000114) 
class defs size 说 
class defs off : 316 (0x00013c) 
data size : 560 
data off : 348 (0x00015c) 
Class #0 * 
Class descriptor : "TFibonacci;" 
Rccess flags : 0x0001 (PUBLIC) 
Superclass : "Ljava/lang/Cbject;" 
JInterfaces 各 
Static fields = 


Direct methods - 
#0 (in IFibonacci;) 
Name <init>" 
Type "Ov 
Pocess : Qx10001 (EPUBLIC OONSTRUCTOR) 
cu 区 
Registers 1 
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Outs EF 
insns size : 416-bit oode nits 
Catches : (none) 
Eositions 
Qx0000 line= 2 
Iocals 时 
0x0000 — 0x0004 reg= 0 this IFibonacci; 
#1 : (in IFibonacci;) 
Name : "fib java' 
Type :DT 
Pooess : 0x0002 (PRIVATE) 
Code 
Registers 6 
Ins 2 
Outs 22 
insns size : 20 16- bit code units 
Catches : (none) 
Positions 
Qx0000 line=5 
Ox0002 line= 6 
0x0003 line= 10 
Iocals 2 
0x0000 — 0x0014 reg= 4 this LFibonacci; 
#2 (in IFibonacci;) 
Name : main' 
Type : ' ([Ljava/lang/String;)V" 
PRccess : Qx0009 (PUBLIC STATIC) 
Code 
Registers 3 
Ins :1 
Outs 2 
insns size : 18 16-bit code nits 
Catches : (none) 
Positions 
Qx0000 line= 15 
Qx0005 line= 16 
Qx000a line=17 
Qx001] line= 20 
Locals 
Virtual methods 衬 
source file idx : 1 (Fibonacci .java) 


其 中 ,Dex 文件 头 包 括 检验 和 、 签 名、 文件 大 小 、 头 大 小 、 字 符 串 、 类 型 .区 域 . 方 法 、 类 相 
关 的 大 小 和 偏 移 量 。 类 信息 包括 类 的 描述 ,访问 标志 位 , 超 类 ,静态 区 域 (名字 、 类 型 .访问 权 
限 ) ,实例 区 域 (名 字 、 类 型 访问 权限 ) ,直接 方法 (名 字 、 类 型 .访问 权限 、 代 码 、 寄 存 器 、 指 令 、 
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输出 ,指令 集 大 小 位 置 等 信息 ) , 虚 方法 等 ,这 些 在 第 3 章 经 做 过 了 详细 介绍 。 

从 反 编译 的 分 析 结 果 不 难看 出 , 反 编译 后 从 类 的 信息 ,可 以 得 
到 类 里 函数 的 功能 ,甚至 是 一 些 函数 参数 的 信息 ,但 更 多 的 信息 还 是 与 Dex 文件 结构 和 字 
节 码 结构 有 关 , 深 入 分 析 还 需要 对 Dex 文件 结构 有 深入 的 了 解 。 从 反 编译 的 来 看 , 程 
序 的 安全 性 不 高 ,通过 反 编 译 Dex 文件 可 以 获得 类 的 相关 信息 ,这 也 提醒 了 程序 员 在 编写 
代码 过 程 中 ,尤其 是 像 Android 这 种 代码 开源 的 操作 系统 ,需要 对 代码 进行 保护 ,以 免 程序 
的 漏洞 被 利用 。 

第 二 种 方法 ,启动 Android 模拟 器 ,在 模拟 器 中 使 用 dexdump 对 Dex 文件 进行 反 编译 。 

第 一 步 : 启动 Android 模拟 器 

启动 Android 模拟 器 ,在 上 述 配置 相关 环境 变量 的 基础 上 ,加 入 一 步 emulator 命令 , 启 
动 模拟 器 。 配 置 及 启动 命令 如 下 : 

(1) . build/envsetup. sh; 

(2) lunch 1; 

(3) Emulator 

(1) 和 (2) 为 配置 环境 变量 命令 ,(3) 为 启动 模拟 器 命令 ,相关 实现 过 程 如 图 4. 3 所 示 。 


OO0@ cheng@cheng-laptop: ~/androidsource/android4.0.4 
File Edit View Tenr 


including device/ti/panda/vendorsetup.sh 
including sdk/bash completion/adb.bash 
cheng@cheng- laptop:~/androidsourc ndroid4.6.45 Lunch 1 


PLATFORM VERSION 
TARGET_PRODUCT=full 

TARGET BUILD VARIAN 

TARGET BUILD TYPI 

TARGET BUILD APPS= 
TARGET_ARCH=arm 

TARGET ARCH_VARIANT=armv7-a 
HOST_ARCH=x86 

HOST_05=linux 

HOST_BUILD TYPE=release 


:~/androidsource/android4.9.4$ emuVator| | 


图 4.3 执行 dexdump 命令 对 Dex 文件 进行 反 编译 


第 二 步 : 创建 SD 卡 并 将 Dex 文件 传 入 SD 卡 中 

Android 模拟 器 创建 一 个 SD 卡 ,首先 将 路 径 转换 到 工作 目录 ,转换 目录 命令 cd 
$WORKDIR。 其 中 ,$ WORKDIR 代表 工作 目录 。 本 例 中 使 用 的 工作 目录 为 Android 虚 
拟 机 的 源码 目录 。 创 建 命令 为 mksdcard 128M sdcard. img # .创建 了 一 个 名 为 sdcard. img 
的 存储 卡 , 大 小 为 128MB。 创 建 SD 成 功 后 ,将 要 查看 的 Dex 文件 使 用 adb push 的 方式 上 
传 到 模拟 器 中 ,创建 一 个 128MB 的 Android 模拟 器 使 用 的 存储 卡 ,具体 的 实现 流程 如 图 4. 4 
所 示 。 

其 中 在 此 过 程 中 ,可 能 会 出 现 “failed to copy “classes. dex” to “/sdcard/classes. dex’: 


x /sdcard/ 


4.4 创建 SD 卡 并 将 Dex 文件 放 入 存储 卡 中 过 程 


Read-only file system ”的 错误 提示 ,使 用 挂 载 相关 命令 解决 此 问题 ,命令 如 下 : adb shell 
mount -0 remount rw 

点 拨 ”在 将 文件 传 入 SD 卡 的 过 程 中 ,SD 卡 只 需 创建 一 次 即 可 。 

第 三 步 : 执行 dexdump 命令 反 编译 Dex 文件 

然后 通过 adb shell 登录 ,找到 要 查看 的 Dex 文件 ,执行 dexdump xxx. dex。 由 于 在 
Android 模拟 器 运行 dexdump 工具 对 SD 卡 中 的 Dex 文件 进行 反 编译 速度 相对 较 
作 生 成 的 文件 接近 100MB, 因 为 使 用 方法 类 似 , 本 节 以 对 Dex 反 编 译 校 验 和 操作 进行 分 析 
为 例 介绍 ,读者 可 以 自己 进行 举一反三 。 具 体 的 命令 如 下 : 执行 dexdump 命令 进行 操作 
adb shell dexdump -c /sdcard/classes. dex checksum. txt, 对 代码 块 的 分 析 命 令 类 似 adb 
shell dexdump -d /sdcard/classes. dex 二 classes20130711. txt, 读 者 有 兴趣 可 以 自己 尝试 。 
执行 反 编 译 命令 如 图 4. 5 所 示 


O00@ cheng@cheng-laptop: ~/androidsource/android4.0.4 


e/android4.0 


图 4.5 执行 dexdump 命令 对 Dex 文件 进行 反 编译 


对 反 编 译 Dex 文件 后 生成 的 文件 的 分 析 与 方法 一 中 的 分 析 相 同 ,已 在 4 
叙述 ,在 此 不 再 袭 述 。 
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4.3 dexdeps 工具 


4.3.1 dexdeps 工具 简介 


dexdeps 工具 主要 完成 对 Dex 文件 .zip 文件 、apk 文件 的 依赖 信息 的 分 析 。 此 工具 转 
储 一 个 Dex 文件 使 用 但 没有 定义 的 字段 和 方法 的 列表 ,并 列举 出 程序 调用 的 不 同 的 库 函 
数 。dexdeps 会 寻找 一 个 “classes. dex” 项 ,用 于 分 析 文 件 的 依赖 信息 。 


4.3.2 dexdeps 工具 使 用 方法 


第 一 步 ,配置 环境 变量 

由 于 运行 工具 或 是 模拟 器 之 前 ,都 需要 设置 环境 变量 ,前文 已 多 次 使 用 并 给 出 了 详细 方 
法 ,后 文 不 再 对 这 一 步 多 做 说 明 

第 二 步 ,启动 dexdeps 工具 分 析 zip 类 型 的 文件 

(1) 对 Dex 文件 进行 分 析 。 

首先 ,转换 到 Dex 文件 所 在 的 目录 。 依 赖 分 析 相 关 命令 如 下 : 

dexdeps * . dex 或 者 将 输出 内 容 写 入 到 一 个 txt 文件 中 ,相关 命令 如 下 : 


Gexdeps * .dex> * .txt 


其 中 , * . dex 表示 人 
图 4.6 所 示 。 


人 人 人 


分 析 的 Dex 文件 , * . txt 表示 输出 的 依赖 文件 , 命 


OO@ cheng@cheng-laptop: ~/dextest 


return="void"> 


Laptop:~/dextest$ 上 


图 4.6 对 Dex 文件 的 依赖 进行 分 析 


(2) 分 析 apk 文件 。 
依赖 分 析 相 关 命 令 如 下 : 


其 中 ,x . apk 表示 任意 待 分 析 的 apk 文件 , * . txt 表示 输出 的 依赖 文件 ,命令 运行 结果 
如 图 4.7 所 示 。 


图 4.7 对 apk 文 件 的 依赖 进行 分 析 


第 三 步 ,分 析 生 成 的 依赖 文件 

从 dexdeps 工具 产生 的 依赖 文件 分 析 , 相 同 的 程序 源码 分 别 转换 成 Dex 文件 和 apk 文 
件 , 对 应 的 依赖 集 差 别 很 大 ,Dex 文件 和 apk 文件 对 应 的 依赖 集 不 同 。 对 Dex 文件 的 依赖 
关系 文件 进行 分 析 , 相 关 依 赖 关系 如 代码 清单 4.4 所 示 

代码 清单 4.4 ”Dex 文件 依赖 代码 


< external file= "fibo.dex"> 
< package name= "java.io"> 
< class name= "PrintStream"> 
< method name= "print in" retum= "void"> 
< parameter type= "java.lang.String"/> 
< /rethod> 
</class> 
< /package> 
< package name= "java.lang"> 
< class name= "Cbject"> 
< onstructor name= "Cbject"> 
< /omnstructor> 
< /class> 
< class name= "String"> 
< /class> 
< class name— "System> 
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< field neme= "out" type= "java.io.PrintStream"/> 
</class> 


点 拨 在 本 节 中 提 到 的 依赖 集 是 指 程序 运行 过 程 中 必须 依赖 的 库 文 件 以 及 包 文件 。 

文件 是 以 XML 文件 的 形式 输出 的 ,可 以 看 出 分 析 的 Dex 文件 的 名 字 ,列举 出 使 用 到 的 
Java 的 包 的 名 字 , 包 里 面具 体 类 的 名 字 , 依 赖 类 中 方法 的 名 字 。 本 例 中 ,使 用 到 的 包 名 为 
java. io, 类 名 为 PrintStream, 具 体 的 方法 名 字 为 println, 返 回 值 void 类 型 ,方法 对 应 的 参数 
类 型 是 java. lang. String。 还 使 用 到 了 java. lang 包 的 类 和 方法 ,类 分 别 是 Object 和 
System, 其 中 Object 类 完成 对 象 的 相关 操作 ,System 类 完成 流 的 输出 。 

不 难看 出 ,使 用 dexdeps 工具 生成 的 分 析 文 件 主要 是 对 在 程序 源 文件 中 调用 的 系统 类 
和 方法 进行 分 析 。 在 程序 源码 中 println() 用 到 了 上 述 类 中 的 方法 。 

而 相反 地 ,分 析 apk 文件 产生 的 输出 文件 apkoutput. txt, 内 容 比较 多 。 同 样 是 完成 一 
个 简单 的 功能 ,apk 文件 相对 于 Dex 文件 所 需要 的 依赖 包 就 多 很 多 类 和 方法 ,apk 文件 需要 
一 些 布局 文件 完成 程序 运行 的 相关 操作 ,用 到 的 很 多 依赖 包 都 是 Android 环境 下 的 包 文件 。 
由 于 生成 的 文件 内 容 较 多 ,选取 一 部 分 进行 分 析 , 相 关 代码 如 代码 清单 4. 5 所 示 。 

代码 清单 4.5 apkoutput. txt 源 代码 


< external file= "Fibonacci.apk"> 
< package name= "Android.acoessibilityservioe"> 
< class name= "ApoessibilityServiosInfo"> 
< method name= "getCanRetrieveWindowContent"” returm= "boolean"> 
< /rethod> 
< method name= "getDescription" retium= "java.lang.String"> 
< /rethod> 
< method name= "getId" retum= "java.lang.String"> 
< /nethod> 
< method name= "getResolveInfo" retur "Android.oontent .pm.ResolveInfo"> 
< /rethod> 
< method name= "getSettingsActivityName" return= "java.lang.String"> 
< /rethod> 


上 述 代 码 中 ,首先 显示 了 进行 分 析 的 apk 文件 名 字 , 包 名 Android 中 的 包 accessibilityservice， 
类 名 AccessibilityServiceInfo, 表 示 访 问 服 务 信息 ,以 下 依次 列举 出 使 用 到 的 包 中 的 方法 名 
字 和 返回 值 。 
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4.4 dexlist 工具 


4.4.1 dexlist 工具 简介 

dexlist 工具 是 一 个 通过 解析 Dex 文件 并 反 编译 其 中 的 类 和 方法 ,实现 列 出 所 有 具体 类 中 
的 一 个 或 多 个 Dex 文件 中 的 所 有 方法 的 功能 。 在 虚拟 机 启动 时 加 载 ,为 虚拟 机 的 部 分 模块 
提供 相关 文件 ,主要 由 Dalvik 虚拟 机 自身 完成 对 该 工具 的 调用 , dexlist 工具 源码 位 于 
Android_dalvik_source\dexlist 目录 下 。 


4.4.2 dexlist 工具 使 用 说 明 


dexlist 工具 是 首先 在 主 函数 中 调用 process() 函数 ,实现 启动 一 个 Dex 文件 分 析 进 程 
的 操作 ,在 函数 中 首先 调用 Dex 文件 打开 、 映 射 、 分 析 等 函 
数 ,其 中 ,dexOpenAndMap() 和 dexFileParse() 这 两 个 函数 


是 类 加 载 过 程 中 非常 核心 的 函数 ,在 类 加 载 章 节 中 已 经 介绍 调用 process() 函 数 启动 
过 了 ,可 以 参见 相关 章节 进行 分 析 。 整 个 工具 的 实现 流程 图 2 
如 图 4.8 所 示 。 调用 dumpclass() 

在 dexlist 工具 主 函 数 main 函数 中 ,首先 ,查找 所 有 实例 对 类 进行 反 编译 
的 完全 限定 的 方法 名 ,循环 运行 列表 中 的 文件 。 在 此 过 程 中 ， i 
usage() 函数 打印 语句 展现 对 应 Dex 文件 结果 ,在 此 过 程 中 调 方法 进行 反 编译 
用 process() 函数 启动 Dex 文件 分 析 进 程 。 相 关 代 码 如 代码 1 

获得 类 名 方法 名 及 

清单 4. 6 所 示 。 文件 名 


代码 清单 4.6 dalvik/dexlist:main() 源 代码 


图 4.8 dexlist 工具 实现 流程 


int main (int argc, char* const argv[]) 
int result= 0; 
int i; 
/* 查找 所 有 实例 的 完全 限定 的 方法 名 。 这 不 是 真正 dexlist 想 要 做 的 ,但 是 在 这 里 是 容易 这 样 做 
的 。* / 
if argc> 3 && stramp argv[1]，" —method")==0) { 
gEamms.argCopy- strdup (argv[2])7 
charx mmethr strrchr(gParmms.argCopy，". 7) 
if neth==NOULD) { 
fprintf (stderr, "Expected package.Class.method\n"); 
free GPamms.argCopy) 
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} 


if argc<23) { 
fprintf (stderr, % s: no file specified\n", gprogNeme); 
usage(); 
retum 2; 
和 
/# 运行 列表 中 的 文件 。 如 果 其 中 一 个 失败 则 继续 ,只 返回 一 个 失败 到 最 后 * / 
for (=1; i <argc; 计 +) 
result |=prooess(argv[i]); 


free (GEarms.argCopy) 7 
retum result; 
} 


Dex 文件 解析 进程 ,打开 Dex 文件 并 映射 到 内 存 中 ,此 时 判断 Dex 文件 是 否 打开 和 映射 成 
功 ,如 果 映 射 不 成 功 ,释放 Dex 文件 .如果 Dex 文件 打开 并 映射 成 功 , 调 用 dexFileParse() 函 
数 开始 分 析 Dex 文件 ,循环 调用 dumpClass() 函 数 对 类 信息 进行 获取 ,该 函数 需要 两 个 参 
数 ,分 别 是 Dex 文件 和 Dex 文件 中 定义 的 类 的 数量 。 对 Dex 文件 进行 解析 。 运 行 一 个 文件 
成 功 返 回 0。 相 关 代 码 如 代码 清单 4.7 所 示 。 

代码 清单 4.7 dalvik/dexlist:process() 函 数 源 代码 


int Process (const char * fileName) 
者 
MenMapping map; 
bool mapped- false; 
int result=- 1; 
UnzipToFileResult utfr; 


Ufr= dexOpenAncMap (fileNeme, NULL, gmap, true); 
让 (utfr != KUTFRSUuC0eSS) { 
if (utfr== KUIFRNoClassesdex) { 
/* 没有 classes.dex 文 件 在 apk 中 ,假设 成 功 。* / 
result=0; 
goto bail; 
} 
fprintf (stderr, "Unable to process '%s'\n", fileName); 
goto bail; 
} 
mapped= true; 


EdexFiler dexFileParse ( (ul * )map.adir, map.length, kdexParseDefault); 
证 (pdexFile==NUIL) { 
fprintf (stderr, Warning: dex parse failed for %s'\n", fileNeme); 
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goto bail; 
} 


printf(#%s\n", fleName); 


int i; 
for (i=0; i < (int) PdexFile >pHeader- > classDefsSize; 计 +) { 
impClass (pdexFile, i); 


对 Dex 文件 中 的 类 中 的 直接 方法 和 虚 方 法 进行 分 析 的 函数 dumpClass() 。 首 先 调 用 
dexGetClassDef() 函 数 从 Dex 文件 中 获得 类 的 定义 ,调用 dexGetClassData() 获 得 类 数据 ， 
调用 dexReadAndVerifyClassData() 函 数 读 取 Dex 文件 验证 类 的 数据 。 判 断 类 的 数据 和 类 
的 定义 是 否 为 空 。 分 别 循环 调用 dumpMethod() 函数 对 直接 函数 和 虚 函 数 进行 反 编 译 , 类 
数据 头 的 直接 方法 的 大 小 作为 循环 反 编 译 直接 方法 的 循环 条 件 , 即 PClassData 一 之 header. 
directMethodsSize, 类 数据 头 的 虚 方 法 的 大 小 作为 循环 反 编 译 直接 方法 的 循环 条 件 
pClassData 一 二 header. virtualMethodsSize。 相 关 代码 如 代码 清单 4.8 所 示 。 

代码 清单 4.8 ”dalvik/dexlist:dumpclass() 函 数 源 代码 

void dnpClass (dexFile* pdexFile, int idx) 

{ 

const dexClassDef * pClassDef; 
aexclasspatax pclassData; 
const ul* penoodedData; 
const char* fileNeme; 

int i; 


EClassDef- dexGetClassDef (pdexFile, idx); 
FEncodedpatar dexGetClassData (pdexFi le, pClassDef); 
EClassDatar dexReadAndVerifyClassData (stEnoodedData, NULT); 


证 (pClassData==NUIL) { 
fprintf (stderr, "Troible reading class data\n"); 
retum; 
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if (pClassDef— > souroeFileldx== 0xffffffff) { 
fileName= NULL; 
}else { 
fileName= dexStringById (pdexFile, pClassDef— > souroeFileldx) ; 
$ 
/* 在 源 文件 定义 每 个 类 的 指针 ,所 以 可 能 应 该 被 打印 出 来 。 然 而 需要 协调 的 工具 ,解析 这 个 输出 * / 
for (i=0; i < (int) pclassData- > header.directMethodsSize; i++) { 
dnpMethod (pdexFile, fileNare, gpClassData- > directMethods[il, i); 


for (i=0; i< (int) pClassData- > header.virtualMethodsSize; 计 +) { 
dnpMethod (pdexFile, fileNeme, gpClassData- > virtualMethods[i], i); 


free (pClassData); 
} 


dumpMethod() 函 数 主要 完成 反 编译 一 个 方法 的 功能 。 获 得 Dex 文件 中 类 的 方法 的 编 
号 和 方法 的 名 字 。 相 关 代 码 如 代码 清单 4. 9 所 示 。 
代码 清单 4.9 dalvik/dexlist:dumpMethod() 函数 源 代码 


void dmpMethod (dexFilex pdexFile, oonst char* 人 leNamey 
const dexMethod* pdexMethod, int i) 
让 

const dexMethodId* pMethodld; 

const dexCodex PCode; 

const char* classDescriptor; 

const charx methodName; 

int firstLine; 


/* 抽象 和 本 地 方法 没有 获得 列表 * / 
证 (pdexMethod- > codeOff==0) 
retum; 


FMethodId= dexGetMethodId (pdexFi le, pdexMethod- > methodIdx) ; 
methodName— dexStringByTd (pdexFi le, FMethodTd > nameTds) ; 


classDescriptor= dexStringByTypeldx (pdexFile, FMethodId- > classIdx); 


FCode= dexGetcode (pdexFile, pdexMethod) ; 
assert (pCode 二 NOLD); 


/* 如 果 文件 名 是 空 的 ,然后 将 其 设置 为 可 打印 的 ,以 便 它 更 易于 解析 * / 
/* 一 种 方法 可 能 会 重 载 其 类 的 默认 源 文件 ,指定 一 个 不 同 的 调试 信息 ,这 种 可 能 性 应 该 在 这 里 处 
理 */ 
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让 (fileNeme==NULL || fileNeme[0]==0) { 
fileNere= " (none) "; 


firstLine=—1; 
dexDecodeDabugTInfo (pdexFile, poode, classDescriptor, FMethodrd >protoIdx, 
PdeshMethod _ > acoessFlags, positionscallback, NULL, sfirstLine); 


Char* className= descriptorToDot (classDescriptor); 
Char* desc= dexCopyDescriptorFrarMethodId (pdexFile, FMethodId); 
u4 insnsoff— pdexMethod- > codeOff + offsetof (dexCode, insns); 


if (gPamms .methodToFind !=NULL && 
(stramp (gPamms .classToFind, className) !=0 | 
stramp (gPamms .methodToFind, methodName) (=0)) 


goto skip; 


Printf("Qx% 08x Sd%s%s%s$ssSdn", 
insnsoff, pCode- > insnsSize * 2, 
className, methodName, desc, 
fileName, firstLine); 


skip: 

free (desc); 

free (className); 
} 


Usage() 是 Dex 文件 加 载 过 程 中 辅助 函数 ,对 dex 文件 进行 打印 。 相 关 代码 如 代码 清 
单 4. 10 所 示 。 
代码 清单 4. 10 ”usage 函数 源 代码 


void usage (void) 

{ 
fprintf (stoerr, "Copyright (C) 2007 The Android Open Source Project\n\n"); 
fprintf (stoerr, Ss: dexfile [dexfile? ...]\n", gProgName); 
fprintf (stderr, \n"); 


/* 定位 表 的 回调 函数 ,我 们 仅仅 想 要 获得 在 这 个 方法 中 第 一 行 的 行 号 ,这 可 能 对 应 着 从 表 中 的 第 一 
村 A 
static int positionsCal lback (void* cnxt，u4 adiress, u4 lineNm) 
{ 
intx pFirstline= (intx ) cnxt; 
证 (* pFirstLine==-1) 
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se 
retum 0; 
二 


通过 对 上 述 dexlist 工具 的 使 用 函数 的 分 析 , 结 合 Dex 文件 的 结构 对 dexlist 工具 对 类 
的 操作 更 加 清晰 。 


4.5 dexopt 工具 


4.5.1 dexopt 工具 简介 


dexopt 工具 作为 一 个 Dex 文件 优化 的 工具 ,主要 完成 由 Dex 或 者 zip 文件 生成 Odex 
文件 ,此 过 程 实现 对 Dex 文件 的 优化 ,提高 Dex 文件 载 人 和 类 加 载 的 效率 , 源码 文件 目录 
Android_dalvik_source\ dexopt\OptMain. cpp 命令 行 的 优化 和 验证 入 口 点 ,这 个 是 文件 编 
译 生成 Dex 优化 工具 。 


4.5.2 dexopt 工具 使 用 方法 


在 dexopt 工具 源码 中 提 到 了 如 下 三 种 启动 dexopt 工具 的 方法 。 

(1) 从 VM 启动 。 这 需要 十 几 个 参数 ,其 中 之 一 是 一 个 文件 的 描述 符 ,该 描述 符 作 为 输 
入 和 输出 。 这 使 我 们 可 以 不 用 考虑 Dex 数据 的 来 源 。 

(2) 从 已 安装 的 或 其 他 本 机 应 用 程序 启动 。 通 过 一 个 用 于 zip 文件 的 文件 描述 符 ,一 个 
用 于 输出 的 文件 描述 符 , 一 个 用 于 调试 消息 的 文件 名 进行 传递 。 对 于 正在 进行 的 活动 可 能 
有 多 种 假设 (允许 验证 十 优化 ,引导 类 的 路 径 是 在 BOOTCLASSPATH 等 ) 。 

(3) 在 主机 上 预先 优化 的 构建 过 程 中 启动 。 与 (2) 类 似 ,只 不 过 它 采 用 的 是 文件 描述 
符 , 而 不 是 文件 名 。 

Android 系统 4. 0. 4 版 本 源码 的 build/tools/dexpreopt/dexopt-wrapper/ 目 录 下 的 
dexopt-wrapper 主 程序 源码 中 的 dexOptwripper. cpp 文件 实现 过 程 中 调用 的 是 /system/ 
bin/ dexopt 程序 ,也 就 是 本 节 介 绍 的 dexopt 工具 。dexopt 工具 并 没有 提供 直接 调用 的 命 
令 , 因 此 ,dexopt-wrapper 工具 可 以 帮助 用 户 通过 命令 调用 dexopt 工具 ,完成 相关 的 优化 操 
作 。 具 体 的 操作 步 又 如 下 。 

第 一 步 ,启动 模拟 器 

由 于 运行 工具 或 是 模拟 器 之 前 ,都 需要 设置 环境 变量 ,前 文 已 多 次 使 用 并 给 出 了 详细 方 
法 ,后 文 不 再 对 这 一 步 多 做 说 明 。 

第 二 步 ,运行 dexopt-wrapper 工具 完成 优化 

首先 将 dewopt-wrapper 工具 放 入 指定 位 置 .将 目录 转换 到 dexopt-wrapper 工具 所 在 
目录 ,命令 为 Adb push dewopt-wrapper /data/local/ 。 然 后 给 dewopt-wrapper 工具 赋予 权 
限 ,命令 为 adb shell chmod 777 /data/local/dewopt-wrapper, 使 用 相同 的 push 方法 将 待 优 
化 的 文件 转换 目录 ,命令 为 adb push Fibonacci. apk /data/local, 紧 接着 调用 命令 . /dexopt- 
wrapper Fibonacci. apk testopt. odex, 其 中 testopt. odex 为 生成 的 优化 文件 名 字 。 完 成 优 
化 后 ,使 用 pull 命令 将 odex 文件 拖 电 出 来 ,命令 为 : adb pull /data/local/testopt. odex。 具 


第 4 章 系统 工具 


体 实现 流程 如 图 4.9 所 示 。 
exopts adb push dexopt-wrapper /data/local/ 
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/ t-wrapper 


Fibonacci.apk 


54 bytes in 09. 
eng- laptop:~/dexop xopt-wrapper Fibonacci.apk testopt.odex 


4.9 Dex 文件 优化 命令 示意 


Dex 文件 的 优化 始 于 Android 源码 中 frameworks 层 ,一 些 参 数 通 过 调用 命令 的 方式 无 
法 直接 获得 ,在 dexopt-wrapper 工具 运行 过 程 中 ,实际 是 为 dexopt 工具 中 Dex 文件 优化 提 
供 这 些 参 数 , 在 优化 过 程 中 ,将 dexopt 的 路 径 字符 串 以 宏 定 义 的 形式 传 入 ,对 文件 后 级 进行 
匹配 判断 是 否 为 zip 文件 ,准备 zip 文件 描述 符 ,生成 Odex 文件 的 文件 描述 符 , 输 出 文件 的 
名 字 ,Dex 文件 优化 选项 。 以 上 这 些 是 dexopt 优化 过 程 中 的 核心 参数 ,用 于 完成 Dex 文件 
优化 。 

dexopt 优化 工具 主要 完成 对 Dex 文件 的 优化 操作 。 对 Dex 文件 进行 解析 ,提高 Dex 文 
件 的 载 入 速度 并 提高 类 加 载 的 效率 。 类 加 载 相关 分 析 将 在 本 从 书 第 二 卷 类 加 载 章 中 介绍 。 


4.6 dvz 工具 


4.6.1 dvz 工具 简介 


dvz 工具 作为 一 个 Framework 框架 调试 的 工具 ,作用 是 从 Zygote 进程 中 触发 出 一 个 新 
的 进程 ,这 个 进程 也 是 一 个 Dalvik 虚拟 机 。 该 进程 与 DalvikVM 启动 的 虚拟 机 相 比 ,区 别 
在 于 该 进程 中 已 经 预 装 了 Framework 的 大 部 分 类 和 资源 。 工 具 的 相关 源码 位 于 Android 
虚拟 机 根 目录 下 , 即 Android_dalvik_source\dvz。 源 码 内 容 比 较 少 ,有 兴趣 的 读者 可 以 阅读 
i 


4.6.2 dvz 工具 使 用 方法 


首先 在 Eclipse 环境 下 编写 一 个 简单 的 Android 应 用 程序 ,并 将 这 个 Android 应 用 程序 
打包 成 apk 文件 ,相信 一 个 Android 程序 开发 人 员 对 于 打包 成 apk 文件 的 过 程 并 不 陌生 。 
相关 代码 如 代码 清单 4. 11 所 示 。 

代码 清单 4. 11 手动 编写 dvz 运行 源 代 码 


Package commndroid.dvztest; 
import java.io. TCExosption; 
import Android.os.Bndle; 
import Android.app.Activity; 
import Android.view.Menu; 
import Android.o0s.Debug; 


piblic class Mainnctivity extends Rctivity { 
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@ Override 

protected void ancreate (Bundle savedInstanoeState) { 
super.anCreate (savedInstanoeState) ; 
setContentView (R.layout. .activity main); 
System.out .print ln ("Hello"); 


} 
piblic static void main(String[] args) 
Systemout.println ("Hello dalvik") ; 
} 
} 


只 是 在 初始 程序 的 基础 上 加 入 static main() 函 数 , 使 用 adb push 将 apk 程序 放 入 模拟 
器 中 。 调 用 dvz -classpath 包 名 称 类 名 。 虽 然 通 过 这 种 方式 完成 了 一 个 类 的 启动 ,但 
MainActivity 类 并 不 是 该 应 用 程序 的 入口 类 ,一 个 apk 的 入 口 类 是 ActivityThread 类 ， 
Activity 类 仅仅 是 被 回调 的 类 ,因此 不 可 以 通过 Activity 类 来 启动 一 个 apk,dvz 工具 仅 用 
于 Framework 开发 过 程 的 调试 。 


小 结 


本 章 相 对 来 说 具有 很 强 的 操作 性 ,从 Dalvik 虚拟 机 的 工具 介绍 ,我 们 看 到 了 Dalvik 虚 
拟 机 运行 过 程 使 用 的 系统 工具 ,同时 从 更 多 方面 了 解 Dalvik 虚拟 机 ,通过 工具 的 使 用 对 虚 
拟 机 内 部 的 实现 机 制 更 加 清晰 ,如 何 实现 Dex 文件 优化 ,如 何 对 封装 的 apk 进行 反 编译 ,如 
何 对 Android 程序 源码 进行 调试 分 析 内 存 泄漏 ,如 何 对 Android 程序 运行 过 程 中 生成 的 
trace 文件 进行 分 析 。 对 于 大 多 数 从 事 Android 程序 开发 的 程序 员 来 说 ,熟练 运用 这 些 工 
具 , 分 析 Android 程序 源码 将 变 得 得 心 应 手 , 内 存 泄漏 作为 常常 被 程序 员 在 编码 过 程 中 忽略 
的 问题 ,资源 使 用 后 未 释放 ,有 时 候 只 有 当 程 序 大 量 消耗 内 存 卡 死 的 时 候 才 体 现 出 来 ,通过 
对 堆栈 和 程序 运行 过 程 中 trace 文件 进行 分 析 , 可 以 准确 定位 程序 中 源码 语句 ,有 效 地 提高 
程序 运行 效率 。 
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本 章 主要 内 容 

全 如 何 对 Android 程序 进行 分 析 ? 

名 通过 开发 分 析 工 具 对 Android 源码 的 调试 方法 有 哪些 ? 
名 如 何 通过 trace 文件 跟踪 分 析 代 码 ? 

全 如 何 分 析 堆 栈 信息 准确 定位 程序 运行 的 内 存 泄漏 ? 

名 DDMS 工具 是 怎样 完成 程序 源码 分 析 的 ? 


5.1 本 章 概述 


在 Dalvik 中 的 工具 很 多 ,在 第 4 章 对 Dex 文件 分 析 工 具 介绍 的 基础 上 ,本 章 结合 
Dalvik 的 开发 分 析 工 具 , 围 绕 源码 分 析 的 相关 操作 展开 ,使 用 Dalvik 中 的 开发 分 析 工 具 对 
Android 程序 源码 进行 分 析 , 使 用 DDMS 完成 对 Android 程序 源码 进行 调试 和 堆栈 分 析 的 
功能 ,可 以 有 效 地 提高 程序 运行 的 效率 和 安全 性 。 

本 章 主要 介绍 程序 开发 过 程 中 分 析 调 试 工具 ,提高 程序 的 安全 性 和 效率 。 为 了 解决 在 
程序 开发 过 程 中 困扰 程序 员 的 内 存 泄漏 、 堆 栈 溢 出 以 及 一 些 不 易 发 现 的 问题 ,Dalvik 虚拟 
机 也 提供 了 对 Android 程序 源码 调试 的 工具 Heap Profile, 分 析 程 序 的 内 存 、 堆 栈 耗 时 以 及 
调用 信息 ,完成 代码 的 优化 功能 。 分 析 程 序 运行 过 程 中 的 trace 的 分 析 工 具 , 对 程序 执行 的 
每 步 进 行 分 析 。DDMS 工具 完成 对 开发 程序 的 具体 包 进 行 调试 分 析 , 通 过 对 包 中 的 进程 、 
线程 以 及 开发 包含 的 具体 变量 的 内 存 ( 堆 \ 栈 ) 的 申请 分 配 情况 的 分 析 调 试 有 助 于 对 开发 应 
用 程序 内 存 分 配 情况 进行 优化 ,开发 高 效 的 程序 。 


5.2 trace 文件 分 析 工 具 


5.2.1 trace 文件 分 析 工 具 简介 


trace 文件 分 析 工 具 是 为 了 更 加 方便 地 了 解 Android 程序 中 的 堆栈 调用 的 次 序 、 消 耗 时 
间 、 调 用 次 数 等 信息 以 及 Android 程序 在 执行 过 程 中 的 调用 关系 和 运行 机 制 ,用 于 分 析 自 己 
编写 的 Android 程序 的 整个 实现 流程 以 及 相关 函数 的 执行 顺序 ,实现 对 局 部 代码 段 的 分 析 ， 
有 效 提 高 对 代码 的 分 析 效率 。 

由 于 Android 程序 开发 大 都 是 在 Windows 操作 系统 下 进行 的 ,所 以 ,在 安装 了 Android 开 
发 环境 的 操作 系统 下 生成 trace 文件 ,对 于 该 工具 生成 的 trace 文件 ,需要 使 用 traceview 工 
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具 对 其 进行 分 析 。 


5.2.2 trace 文件 分 析 工 具 使 用 方法 


第 一 步 ,在 代码 段 中 加 入 调试 命令 

在 需要 进行 调试 的 代码 前 一 行 加 入 Android. os. Debug. startMethodTracing ("/sdcard/ 
test"); ,表示 调用 Android 调试 模式 下 的 调试 方法 , 插 号 内 表示 生成 文件 的 对 应 路 径 和 生 
成 文件 的 文件 名 ,示例 中 stratMethodTracing() 方 法 ,参数 为 SD 卡 中 文件 名 为 test 的 trace 
文件 。 在 结束 调试 的 代码 的 后 一 行 加 入 Android. os. Debug. stopMethodTracing() ;调试 生 
成 trace 文件 使 用 到 的 代码 如 代码 清单 5. 1 所 示 。 

代码 清单 5.1 手动 编写 trace 调试 程序 源 代码 


Fackage om.yucheng.fibonacci; 
import java.io.IOExosption; 
inmport Android.os.Bundle; 
import Android.app.Activity; 
import Android.o0s.Debug; 


Public class Minactivity extends Activity { 


@ Override 
Protected void onCreate (Bundle savedInstanceState) { 


Super.onCreate (savedInstanceState) ; 
SetContentView (R.layout .activity main); 
test (); 
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Eublic static void test () 

{ 
Android.o0s.Dsbug. startMethodTrracing ("/sdcard/test"); 
System.aut.println ("Hello dalvik"); 
Android.0s.Debug. storMethodTracing(); 


} 


在 上 述 程序 中 再 自 定 义 一 个 test0 〇 方法 ,在 这 个 方法 里 加 入 了 上 述 提 到 的 trace 的 调试 
代码 ,用 于 生成 trace 文件 。 

由 于 在 运行 过 程 中 apk 程序 需要 对 Android 模拟 器 中 的 SD 卡 进行 写 人 操作 ,所 以 需 
要 在 Android 程序 工程 的 AndroidManifest. xml 文件 中 加 入 权限 允许 的 代码 ,否则 会 有 
permission denied 的 错误 提示 。 相 关 代码 如 下 : 


<uses- Permission Rndroiqd:name= "Android.pemmission.WRITE, EXTFFNRL SICRAGE"> 
</uses- Permission> 
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<Uses- Fermissicn Android:name= "Android.permissin.MINT UNMOUNT FTIESYSIEMS"> 
</uses- Permissicn> 


如 果 不 在 AndroidManifest. xml 的 源 文件 中 添加 ,也 可 以 在 如 图 5. 1 所 示 的 方法 中 进 
行 添加 。 


扎 Android Manifest Permissions 


Permissions ONOA: Attributesfor 
android.permission.WRITE EXTERNAL STOR 
AGE (Uses Permission) 


TIhe. J 


© android.permission.WRITE E 
@@ android.permission.MOUNT| 


中 


tag requests a {@link 

Up #AndroidManifestPermission <permission>} 
that the containing package must be 
granted in order for it to operate correctly. 


Name ission.WRITE_EXTERNAL STORAGE ~ 


图 5.1 添加 Android 应 用 程序 的 权限 


第 二 步 ,发 布 apk 程序 ,生成 格式 为 trace 的 文件 

为 了 保证 程序 的 运行 流畅 和 生成 的 trace 文件 可 以 成 功 保存 ,建议 在 创建 Android 模拟 
器 时 ,将 RAM 设置 为 512MB, 将 SD 卡 容量 设置 为 512MB 或 者 更 大 ,在 Eclipse 平台 下 对 
编写 的 Android 程序 进行 编译 生成 对 应 的 apk 文件 ,将 生成 的 apk 文件 传人 Android 模拟 
器 的 SD 卡 中 。 


Wy ee ep , Te 
选择 debug as 命令 在 debug 模式 下 运行 Android 程序 。 运 行 过 程 中 相关 日 志 如 图 5 

所 示 , 在 图 中 第 一 行 可 以 清晰 看 到 trace 文件 生成 。 

07-18 07:32:20,.095 884 884 com, yucheng. fibon,.. dalvikym TRACE STARTED: '/sdcard/test,trace' 8192WB 

07-18 07:32:20.515 884 884 com. yucheng.fibon... dalvixvm +++ active profiler count now 1 

07-18 07:32:20.527 884 884 com. yucheng. fibon... System.out Hello dalvik 

07-18 07:32:20.527 884 884 com.yucheng.fibon... dalvikvm +++ active profiler count now 0 

07-18 07:32:20.885 884 884 com. yucheng.fibon... dalvikvm TRACE SIOPPED: writing 45 records 

07-18 07:32:22.816 884 884 Com.yucheng.fibon... gralloc gold.. Emulator without GPU emlation detected. 


图 5.2 调试 生成 trace 文件 日 志 信 息 


第 三 步 ,使 用 traceview 工具 分 析 trace 文件 

将 生成 的 trace 格式 文件 从 SD 卡 中 复制 到 PC 端 。 使 用 traceview 软件 对 生成 的 trace 
文件 进行 分 析 。 使 用 adb pull 命令 将 SD 卡 中 的 文件 复制 到 PC 端 ,这 个 命令 已 在 前 面 章 节 
多 次 使 用 ,具体 命令 为 adb pull /sdcard/test. trace D:/ ,实例 命令 表示 将 sdcard 目录 下 的 
test. trace 文件 复制 到 D 盘 根 目录 下 ,操作 过 程 如 图 5. 3 所 示 。 


5.3 将 SD 卡 上 的 文件 复制 到 PC 端 


使 用 traceview 工具 打开 test. trace 文件 .具体 操作 命令 如 下 : traceview D:\ test. 
trace。 其 中 调用 traceview 为 使 用 traceview 工具 ,后 面 加 入 待 打 开 文 件 路 径 , 操 作 的 过 程 
如 图 5.4 所 示 。 
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图 5.4 将 SD 卡 上 的 文件 复制 到 PC 端 


使 用 traceview 工具 打开 刚刚 使 用 debug 调试 模式 生成 的 trace 文件 ,如 图 5.5 所 示 。 


图 5.5 打开 trace 文件 示意 图 


分 析 trace 文件 的 过 程 中 ,可 以 将 鼠标 放 在 窗口 上 方 的 水 平 轴 上 ,可 以 清晰 地 看 到 程序 
中 每 个 线程 调用 方法 的 启动 和 停止 时 间 。 分 析 程 序 每 一 步 的 流程 ,定位 程序 源码 中 存在 问 
题 的 代码 。 


5.3 Heap Profile 工具 


5.3.1 Heap Profile 工具 简介 


说 到 程序 的 内 存 泄漏 大 家 并 不 陌生 ,平时 编写 的 程序 中 常常 会 出 现 内 存 泄漏 ,但 是 往往 
找到 内 存 泄漏 却 是 棘手 的 ,Heap Profile( 以 下 简称 Hprof) 是 一 个 调试 程序 代码 并 分 析 
Android 程序 内 存 情 况 的 工具 。 通 过 在 程序 运行 过 程 中 ,在 指定 目录 下 生成 hprof 格式 的 
文件 ,使 用 hprof-conv 工具 对 hprof 格式 文件 进行 转换 ,结合 内 存 分 析 工 具 Memory 
Analyzer Tool( 以 下 简称 MAT) 对 hprof 标准 格式 文件 分 析 , 了 解 程序 运行 过 程 中 的 内 存 情 
况 , 发 现 程序 代码 中 存在 的 潜在 问题 ,便于 程序 员 对 代码 进行 修改 优化 .以免 存 在 问题 ,避免 
产生 程序 大 量 占用 内 存 的 情况 ,甚至 产生 被 利用 的 漏洞 。 

由 于 进行 Android 程序 开发 的 程序 员 主 要 是 在 Windows 操作 系统 下 完成 ,Hprof 是 对 
源码 进行 调试 的 工具 .为 了 程序 编译 运行 的 方便 ,Hprof 工具 的 使 用 也 主要 在 Windows 操 
作 系 统 下 进行 。 

分 析 Android 操作 系统 程序 的 方法 有 两 种 ,一 种 是 利用 Android 平台 提供 的 Android. 
util. Log 通过 log 信息 来 分 析 错 误 发 生 的 原因 ;另外 一 种 是 通过 设置 断 点 ,一 步 一 步 地 跟踪 
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程序 发 现 问题 。 这 两 个 方法 非常 有 效 , 介 绍 相关 方法 的 资料 也 很 多 。 

还 有 一 类 常见 的 问题 就 是 Memory Leak。 对 内 存 泄 漏 这 类 问题 ,以 上 两 种 方法 不 是 很 
有 效 , 在 DDMS 工具 里 面 ,也 基本 上 只 能 查看 到 Heap 的 使 用 情况 ,对 分 析 问 题 帮助 不 大 。 
可 以 利用 Eclipse MAT 工具 来 分 析 此 类 问题 。 本 节 将 通过 Memory Analyzer 这 一 个 快速 
并 且 功 能 强大 的 Java heap 分 析 器 分 析 hprof 文件 ,能 够 帮助 查找 内 存 泄漏 并 减少 内 存 
消耗 。 


5.3.2 Heap Profile 工具 使 用 方法 


第 一 步 , 在 程序 运行 过 程 中 生成 hprof 文件 。 

在 程序 代码 中 加 入 生成 hprof 文件 所 需 的 调试 语句 ,在 引入 的 头 文件 中 包括 : 

import java.io. TOExosption; 

import Android.os.Debug; 

使 用 dumpHprofData 函数 将 生成 的 hprof 文件 导出 到 模拟 器 中 事先 建立 的 tmp 文件 
夹 下 ,核心 的 调试 代码 段 如 下 : 


try { 
Android.os.Debug.drpHprofData ("/data/brmyinput.hprof")7 
} 
catch (IOExcepticn ice) 
{ 
System.cut.println ("a error"); 
3 


作者 使 用 的 简单 示例 的 相关 代码 如 代码 清单 5. 2 所 示 。 
代码 清单 5.2 手动 编写 堆栈 分 析 源 代码 


Package om.yucheng.fibonacci; 
import java.io. IOEwosption; 
import Android.os .Bndle; 
import Android.app.Activity; 
import Android.view.Menu; 
import Android.os.Debug; 


piblic class Mainnctivity extends Bctivity { 


@ Override 

protected void cnCreate (Bundle savedInstanoeState) { 
super.onCreate (savedInstanoeState) ; 
setContentView (R.layout .activity main); 


long result= fib java(3); 
System.cut.println (result); 
try{ 
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PRndroidq.os.Dabug.dmpHprofData ("/data/trp/input .hprof"); 
} catch (IOExocepticn ioe) { 
System.out .printIn ("a error"); 


Public long fib java(int rm) 


¥ 
if (mme=0){ 
retum nm 
} 
else 
愉 
retum 0; 
} 
} 


第 二 步 , 将 hprof 文件 从 模拟 器 中 复制 到 PC 端 , 使 用 hprof-conv 工具 将 hprof 文件 转 
换 成 标准 格式 。 

将 目录 转换 到 hprof 文件 所 在 的 文件 路 径 , 使 用 adb pull 命令 将 生成 的 hprof 文件 从 存 
储 路 径 复 制 到 PC 端 。 但 是 这 时 候 生成 的 hprof 文件 并 不 是 标准 格式 的 ,需要 使 用 Android 
SDK 中 的 hprof-conv 工具 进行 转换 ,首先 将 文件 路 径 转 换 到 hprof, 然 后 运行 进行 标准 格 
式 的 转换 相关 的 命令 为 : hprof-conv input. hprof out. hprof。 具 体 实现 流程 如 图 5. 6 
所 示 。 


国 管理 员 : C\Windows\system32\cmd.exe ee [ES 一 X 一 | 
Micro. 本 1 


5.6 将 生成 的 hprof 格式 文件 转换 成 标准 格式 


如 果 直 接 使 用 MAT 进行 分 析 , 将 提示 “Unknown HPROF Version (JAVA PROFILE 
1.0.3) (java. io. IOException)” 异 常 , 如 图 5.7 所 示 。 

点 拨 不 要 以 为 是 MAT 的 版 本 不 对 ,其 实 是 Android 的 hprof 文件 在 这 里 需要 进行 
转换 成 标准 格式 才 可 以 使 用 MAT 打开 ,都 是 相同 的 文件 格式 ,不 知道 谷歌 在 这 里 做 了 什么 
文章 ,难道 是 做 了 什么 优化 ? 有 兴趣 的 读者 可 以 研究 下 。 

第 三 步 ,使 用 MAT 分 析 。 

在 生成 标准 hprof 文件 格式 后 ,需要 使 用 内 存 分 析 工 具 对 hprof 文件 进行 分 析 。 作 者 
在 前 段 时 间 做 的 一 个 Android 项 目的 过 程 中 ,出 现 Exception in thread "main" java. lang. 
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四 probemocurdd Eee 


‘parsing heap dump from ‘DAhprof\input hprof” 
has encountered a problem. 


Error opening heap dump 'inputhprof. Check the 
error log for further details. 


es) Co ] 


Error opening heap dump 'inputhprof. Check the error ~ 
log for further details. 
Error opening heap dump 'inputhprof. Check the 
error log for further details. 
Unknown HPROF Version UAVA PROFILE 1.0.3) 
Gava.io.lOException) 
Unknown HPROF Version UAVA PROFILE 1.0.3) 


图 5.7 未 转换 的 非 标 准 格 式 hprof 文件 提示 错误 


OutOfMemoryError: Java heap space 这 个 错误 ,所 以 需要 查找 原因 ,就 用 到 MAT。 由 于 
MAT 不 是 Eclipse 自 带 的 工具 所 以 需要 在 Eclipse 下 手动 配置 MAT。MAT 的 配置 过 程 
如 下 。 

(1) 下 载 Eclipse MAT 工具 。 

从 http://www. eclipse. org/mat/downloads. php 网 站 上 下 载 Eclipse MAT。 

下 载 页 如 图 5. 8 所 示 。 


Memory Analyzer 1.3.0 Release 
m Version: 1.3.0.20130517 | Date: 26 June 2013 | Type: Released 
m Update Site http://download.eclipse.org/mat1.3/update-site/ 
m Archived Update Site MemoryAnalyzer-1.3.0.201305170842.zip (12 MB) 


= Stand-alone Eclipse RCP Applications 
图 windows (x86) (46 MB) 
图 windows (x86_64) (46 MB) 
圆 wacosx (MaciCarbon) (45 MB) 
图 wacosx (MaciCocoa x86) (45 MB) 
圆 Mac OSX (Mac/Cocoa x86_64) (45 MB) 
圆 Linux (x86/GTk 2) (46 MB) 
图 Linux (x86_64/GTK 2) (46 MB) 
图 Linux (PPC64IGTK 2) (43 MB) 
国 solaris 8 (x86/GTK 2) (45 MB) 
图 solaris 8 (SPARC/GTK 2) (45 MB) 
圆 hp-ux (A64_32GTK) (43 MB) 
AIX (PPCIGTK) (44 MB) 
图 Ax (ppc64/GTK) (44 MB) 


图 5.8 下 载 MAT 的 页 面 


(2) 下 载 之 后 将 压缩 包 解 压 ,作者 使 用 的 继承 了 Android SDK 的 Eclipse 开发 环境 , 放 
置 到 Eclipse 的 \adt-bundle-windows-x86-20130522\ eclipse \ dropins 目录 下 ,如 图 5. 9 
所 示 。 

返回 到 上 一 级 目录 , 即 \eclipse\dropins 目录 下 ,新 建 一 个 文件 , mat. link 文件 内 容 如 
下 : path 王 MAT 的 解压 路 径 。 本 例 中 的 mat. link 文件 的 内 容 如 下 ,注意 本 例 使 用 “\\” 因 
为 是 转 义 字符 。 
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522 ， eclipse » dropins » MemoryAnalyzer-1.2.1.201211051250 » Bab. 

新 建文 件 去 
回 名 称 修改 日 其 类 型 大 小 

出 features 2012/11/6 3:16 ”文件 实 
出 plugins 2012/11/6 3:15 文件 夫 
pp" web 2012/11/6 3:13 文件 去 
国 artifactsjar 2012/116 3:15 Executable Jar File 2KB 
国 contentjar 2012/11/6 3:15 Executable Jar File 13KB 
司 indexhtml 2012/11/6 3:13 HTML 文 档 2KB 
Bl notice.html 2012/11/6 3:13 HTML 文 档 10KB 

回 LL sitexml 2012/11/6 3:15 XML 文档 2 KB 


图 5.9 解压 MAT 到 Eclipse 安装 目录 


path= D:\\adt— bundle— windows- x86- 20130522\Nadt- bundle— windows- x86- 20130522\\ 

eclipse\ \dropins\ \MemoryAnalyzer— 1.2.1.201211051250 

(3) 重新 启动 Eclipse, 使 用 MAT 进行 分 析 。 

在 成 功 安装 了 MAT 后 , 单 击 菜单 栏 上 面 的 Windows 下 的 Preference 选项 ,会 在 弹出 
的 窗口 中 显示 出 Memory Analyzer 工具 。 再 从 菜单 栏 中 选择 “文件 ”>“ 打 开 ” 选 项 ,打开 要 
分 析 的 hprof 文件 。 打 开 hprof 文件 的 主 界面 如 图 5. 10 所 示 。 


Toveriew ET 
“Dealls 
Sse: 18 MB Classes 27k Objects: 40 8k cass Looder 4 Uareachable Otiects Histogram 


~ Biggest Objects by Retained same 
IRT Chart Engine (>230 not avaiable. No pie Woday. Check-out the Dominator Tree or Top Consumers. 
~ Actions ~ Reports ~ Step By Step 
MM Hiatogtam Uists mmber of instances per leak Sspects: indvdes leak wspects and o Component Repoq Analyre objeet wheh 
dass Sptem Overview belong to 3 common root package or cass 
Ya Dominator Tree: Uist the biggest objects and Tap Components: st reports for Mmm. 
hat her beep sive omponerts bgger than 1 percert of te 
Tog Consumers, Print he men expentive iin 
objects grouped by class and by package. 
Duplcate Classes: Detect casses loaded by 
miple dass loadorr 


图 5.10 生成 的 内 存 分 析 报 告 


单 击 图 5. 10 中 的 Reports 一 Leak Suspects 则 可 以 进一步 看 到 更 详细 的 内 存 泄漏 疑点 。 
相关 的 内 存 泄露 疑点 的 信息 如 图 5. 11 所 示 。 

想 要 查看 更 多 更 全 的 信息 ,可 以 通过 table of content 获得 .具体 信息 如 图 5. 12 所 示 。 

MAT 是 一 个 很 强大 的 内 存 分 析 工 具 , 对 于 分 析 程 序 源码 较 大 的 Android 工程 帮助 很 
大 ,可 以 帮助 快速 定位 产生 内 存 泄漏 的 类 。 在 平时 编写 程序 的 过 程 中 ,内 存 泄漏 往往 是 容易 
被 忽略 的 ,但 是 当 一 个 小 的 问题 扩大 化 的 时 候 , 就 会 产生 一 个 巨大 的 效果 。 对 于 PC 端的 程 
序 , 当 内 存 泄漏 比较 严重 的 时 候 , 会 出 现 大 量 占用 内 存 使 内 存 计算 机 卡 机 的 情况 ,对 于 
Android 应 用 程序 ,由 于 本 身 移动 设备 的 内 存 容量 就 有 限 , 内 存 泄漏 现象 将 导致 移动 设备 卡 
机 ,甚至 导致 机 器 重启 。 
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i Overview | 忆 default_report org.edipse,matapisuspects ?3 


Leak Suspects 
System Overview 


2.735 nstances of “java.lang.Class”, loaded by "<system class loadery” occupy 
工 052.384 (55.34%%) byres， 


Biggest instances: 


| 
| 

| 

| 

| 

| dass android,text. Htmi$Humlparser @ 0x40b32a78 - 126,632 (6.66%] bytes. 

| dass org.apache.harmony,security foreress.Services @ 0x40b495a0 - 80,120 

| (021%) byres. 

| dass lbcore.icu.TimeZones @ 0x40a6d2b0 - 69,144 (3.64%) byres, 

| cass com android neemal Restyleable ® Osos8e34e 57,120 [3.00%) byees. 
| » dass android.R$styleable @ 0x403d72c8 - 52.896 (2.78%) bytes 
| 

| dass androidtextAuraTexr @ 0x40b8f58 - 31,656 (1.66%) 

| dss androld contene res Resources © Ox40b025d0 ~ 24, 生生 so byees. 

| 

| 


a 


tava lang. Cass 


站 


~ © problem Suspect 2 


De 


7,657 nstances of “java.lang. String”, londed by “<system class loader>” occupy 
484,664 (25.48%) byres 


| Keywords 
| java,lang. String 


Ee 


图 5.11 内 存 泄漏 疑点 


Table Of Contents 


图 5.12 内 存 信息 的 详细 列表 


5.4 DDMS 工具 


Dalvik 调试 监视 服务 (Dalvik Debug Monitor Service, DDMS) 是 由 Android 软件 开发 
包 提 供 的 调试 工具 。 开 发 人 员 可 以 使 用 DDMS 提供 的 窗口 来 监视 模拟 器 或 真实 设备 的 调 
试 ,包括 为 测试 设备 截屏 ,针对 特定 的 进程 查看 正在 运行 的 线程 以 及 堆 信息 、Logcat 广播 状 
态 信 息 、 模 拟 电话 呼叫 接收 SMS 虚拟 地 理 坐标 等 。 它 是 几 个 工具 的 融合 : 任务 管理 器 
(Task manager) ,文件 浏览 器 (File Explorer) 模拟 器 控制 台 (Emulator console) 和 日 志 控 
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制 台 (Logging console) 。 
5.4.1 启动 DDMS 

启动 DDMS 有 以 下 两 种 方法 。 

(1) 如 果 没 有 使 用 集成 开发 环境 Eclipse, 那 么 DDMS 可 以 单独 的 进程 运行 ,位 
Android 软件 开发 包 中 /Tools 目录 下 ,双击 运行 ddms. bat 文件 ,如 图 5. 13 所 示 。 


ethod 
ocketDispat 1 ocketDispatc 
fferCIOUtil. ja 


com- 


com.android.ddmlib 9 " .openClient (DeviceMonito 
droid.ddmlib.DeviceMonitor. dupDa 


at com.android.ddnlib.DeviceMonitor.deviceClientMonitorLoopCDeviceMonito 
at con. -ddnlib.DeviceMonitor.ac 
at com- -ddmlib-DeuiceHonitorS3 -Pu 


图 5.13 DDMS 通过 dat 工具 单独 启动 


这 样 DDMS 将 运行 在 自己 的 进程 中 ,并 自动 调用 Android Device Monitor 自动 连接 到 
Emulator。 监 视 器 连接 界面 如 图 5. 14 所 示 


Cl 本 mr 一 


Fe Edt Adions Device 
站 > @ Sysirfo | Network | Emulator Control | Evert Log| 
Name cpu load ™ | [Update from Device 
2 ndroid lemul Online mo me 
comandro 1752 ”和 蕊 8600 
| 
Saved Filers Fe with pid apPs, tag: or 
Allmessagas (nc 
Appicasien 


图 5.14 DDMS 监视 器 连接 界面 
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(2) 如 果 使 用 集成 开发 环境 Eclipse, 并 且 安 装 了 Android 开发 工具 插件 ,DDMS 工具 
就 已 经 结合 到 了 集成 开发 环境 中 。 通 过 DDMS, 可 以 浏览 计算 机 上 运行 的 模拟 器 实例 ,并 
且 可 以 通过 USB 连接 真实 的 Android 设备 进行 调试 。 在 Eclipse 调试 程序 的 过 程 中 启动 
DDMS, 在 Eclipse 中 的 界面 如 图 5. 15 所 示 。 


Pll¢ boo 目 Andreid Vetunl price Nanogrr 
Me! Ran hrcdecid lint 
etern Prelereners 


司 androidMariiost ml 
大 ieuncherwebprg 
国 preguard-projectas 
国 preject properes 


EEC 
co snrold. cdaltb-Handleheep .spnd 


图 5.15 ”Eclipse 集成 DDMS 启动 过 程 


可 以 通过 Eclipse 看 到 DDMS 工具 中 包含 一 个 模拟 器 实例 ,如 图 5. 16 所 示 。 


| | oe El 
owee 3 0 和 Ios 目 Hap Neowo- 人 Nanok- Hibpe. amuato' 7 Tmtemne [SIO 
埋 | 导 康 自 | 革 半 | 外 | 枉 | 昌 | 
1 > Teephemy Stanus 


ordred fem ovine 
«219 


Nome | re 


comandre 1353 
comandre 1372 
andrcidpr 1410 
comandro 1406 


= 入 


or mescages. Mecepts Ja regems. Profir with pid:, app t29: or ext io Bmit scope. eos | 日 眼 加 4 


7oM ofliaM 而 


图 5.16 DDMS 调试 界面 包含 的 设备 


DDMS 对 Emulator 和 外 接 测试 机 有 同等 效用 。 如 果 系 统 检测 到 它们 (VM) 同 时 运行 ， 
那么 DDMS 将 会 默认 指向 Emulator。 并 且 在 同一 时 间 只 运行 一 个 DDMS 实例 。 其 他 运行 
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的 DDMS 会 被 忽略 。 


5.4.2 DDMS 原理 和 特性 


DDMS 将 搭建 起 IDE 与 测试 终端 (Emulator 或 者 connected device) 的 连接 ,它们 应 用 
各 自 独 立 的 端口 监听 调试 器 的 信息 ,DDMS 可 以 实时 监测 到 测试 终端 的 连接 情况 。 当 有 新 


的 测试 终端 连接 后 ,DDMS 将 捕捉 到 终端 的 ID ,并 通 


system process 368 


androidprocessmed 749 8615 
com.example.testsar 786 8619 


ET Li 


< 国 emuator5554 Online android BA 
8600 


图 5.17 DDMS 监视 器 包含 设备 
的 连接 端口 分 布 


过 adb 建立 调试 器 ,从 而 实现 发 送 指令 到 测试 终端 
的 目的 。 

如 图 5. 17 所 示 ,DDMS 监听 第 一 个 终端 App 进 
程 的 端口 为 8600, App 进程 将 分 配 8601, 如果 有 更 
多 终端 或 者 更 多 App 进程 将 按照 这 个 顺序 以 此 类 
推 。 DDMS 通过 8700 端口 (“base port”) 接 收 所 有 
终端 的 指令 。 

(1) 在 左上 角 , 将 能 够 找到 处 于 运行 状态 的 模拟 
器 和 连接 的 设备 。 

(2) 文件 浏览 器 方便 查看 模拟 器 和 设备 上 的 文 
件 (包括 应 用 程序 文件 .目录 和 数据 库 ) ,并且 可 以 进 
行 提取 和 添加 。 

(3) LogCat 窗口 能 够 让 用 户 监视 Android 日 志 
控制 台 (LogCat) 。 这 里 显示 Log. i()、Log. e() 和 其 
他 Log 方法 调用 产生 的 消息 。 


(4) 可 以 查看 每 一 个 进程 ( 堆 和 线程 更 新 ), 也 可 以 查看 每 一 个 线程 ,还 可 以 终止 进程 。 
可 以 触发 进程 上 的 “垃圾 回收 (garbage collection)”, 并 随后 查看 应 用 程序 所 使 用 的 堆 。 

(5) 可 以 使 用 Screen Capture( 屏 幕 捕 提 ) 按 钮 来 捕捉 模拟 器 和 设备 上 的 屏幕 画面 。 

(6) 随时 可 以 使 用 模拟 器 控制 台 ,发 送 GPS 消息 、 模 拟 来 电 或 者 SMS 发 送 消息 。 


5.4.3 DDMS 具体 功能 


1. Device 

如 图 5. 18 所 示 , 在 左上 角 可 以 看 到 标签 [ER -一 
为 “Devices” 的 面板 ,这 里 可 以 查看 到 所 有 与 素 | 目 鲜 自 | 务 沁 |@@| 通 | 国 | 放 六 
DDMS 连接 的 终端 的 详细 信息 ,以 及 每 个 终端 | 和 On 
正在 运行 的 App 进程 ,每 个 进程 最 右边 相对 应 | Seempoess a9 RRA 
的 是 与 调试 器 连接 的 端口 。 因 为 Android 是 eg C3 
基于 Linux 内 核 开发 的 操作 平台 ,同时 也 保留 comandroidlaunche 525 605 
了 Linux 中 特有 的 进程 ID, 它 介 于 进程 各 和 端 i 2 
口号 之 间 。 0 Re 


并 且 可 以 通过 Devices 面板 进行 一 些 操作 ， 图 5.18 DDMS 监视 器 连接 界面 面板 操作 按钮 
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例如 Debug the selected process、Update Threads、Update Heap、Stop Process 和 ScreenShot。 
并 且 调 试 选择 的 进程 时 ,为 其 关联 一 个 调试 器 ,这 样 就 可 以 在 提供 了 源 代码 的 情况 下 调试 这 
个 进程 。 

点 拨 ”DDMS 调试 过 程 中 只 能 选择 一 个 虚拟 机 实例 或 真实 设备 进行 连接 。 


2. Emulator Control 


通过 这 个 面板 的 一 些 功 能 可 以 非常 容易 地 使 测试 终端 模拟 真实 手机 所 具备 的 一 些 交互 
功能 ,比如 : 接听 电话 ,根据 选项 模拟 各 种 不 同 网 络 情 况 ,模拟 接收 SMS 消息 和 发 送 虚拟 地 
址 坐标 用 于 测试 GPS 功能 等 ,如 图 5. 19 所 示 。 


网 Teas ep Alocato TF Newort riebplo O Em 5 Demin 


Telepheny satus 
Voice home 可 speed [Eu 


Ns— 


Telephony Actions 

Incoming numbar 13333333333 
OvVeice 

SMS 

Message: Helo world! 


国 [ 呈 本 


Location Cortrole 


KML 


Longiude -122084095 
Latitude 37.422006 


四 


高 司 | 四国 "= 口 


图 5.19 DDMS 监视 器 虚拟 机 控制 界面 


Telephony Status: 通过 选项 模拟 语音 质量 以 及 信号 连接 模式 。 

Telephony Actions: 模拟 电话 接听 和 发 送 SMS 到 测试 终端 。 

Location Controls: 模拟 地 理 坐 标 或 者 模拟 动态 的 路 线 坐 标 变化 并 显示 预 设 的 地 理 标 
识 , 可 以 通过 以 下 三 种 方式 。 

(1) Manual: 手动 为 终端 发 送 二 维 经 纬 坐标 。 

(2) GPX: 通过 GPX 文件 导入 序列 动态 变化 地 理 坐 标 , 从 而 模拟 行进 中 GPS 变化 的 
数值 。 

(3) KML: 通过 KML 文件 导入 独特 的 地 理 标 识 , 并 以 动态 形式 根据 变化 的 地 理 坐标 
显示 在 测试 终端 。 


5.4.4 进程 监控 


DDMS 非常 有 用 的 一 个 特性 在 于 可 以 同 进程 进行 交互 。 每 一 个 Android 应 用 程序 都 
有 一 个 独立 的 用 户 ID 运行 在 模拟 器 中 。 
通过 DDMS 的 Devices 面板 可 以 查看 连接 的 模拟 器 实例 ,每 一 个 都 以 其 包 名 作为 标识 。 
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通过 面板 可 以 做 到 : 
(1) 在 Eclipse 中 关联 并 调试 应 用 程序 ; 
(2) 监视 线程 ; 
(3) 监视 堆 ; 
(4) 终止 进程 ; 
(5) 强制 进行 垃圾 回收 。 
例如 ,通过 图 5. 20 可 以 看 到 包 com. android. inputmethod. latin 运行 在 模拟 器 上 。 
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emer mine dA 
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图 5.20 DDMS 调试 过 程 中 堆 使 用 情况 


选 定 感 兴趣 的 进程 ,并 同时 选择 Update Threads 选项 后 , 则 在 右边 线程 中 可 以 查看 运 
行 时 所 包含 的 线程 数目 以 及 线程 的 详细 信息 ,如 图 5. 21 所 示 。 


目 Hep © Alocatio. SNewok -MW Fiebol., Emubtor. 7 Sytem © 


ID Td Sow vime stme Nome 

1 1255 Natve 7 24 man 

人 1259 vmwat s 19 6C 

“3 1260 vmwak 0 0 Signal Catcher 

[4 126l Runnable 1383 4293 JOWP 

“5 1262 Vmwak 2 7 Compler 

“6 1263 Wat 0 0 ReferenceQueseDaemon 
7 1204 Wet 16 6 FinalizerDaemon 

3 1265 Wat 0 9 FinalizerWatchdogDaemon 
9 1280 Native 5 3 Binder1 

19 12s1 Natve 5 1 Binder2 

1 1373 Wat 20 19 pooH2threed-1 

2 1349 Wat 0 9 pooklthread1 

3 1374 Wet 日 0 pook3-thread-1 

14 1375 Wat 0 1 pool4threedl 

15 1376 Netive 0 0 InputJpdater 


Refrash]| Mon Dec 09 21:2231 CST 2013 
at orgapache.harmony.dalvikcddmec. DdmVminterral.getStackTraceByld (Native Method) 
a andrcid.ddm DdmHardieThread handiesTL DdmHandleThresdjava131) 
at android.ddm DdmHardieThreed hardieChunk(DdmHandleThreadjava77) 
at orgapache.harmony.dalvikddme. DdmServer .dispatch(DdmServerjava:17) 
a dahiksystem Nativestart run(Native Method) 


蕊 轴 | 吓 目 -~ 呈 - 呈 日 
图 5.21 DDMS 调试 过 程 中 包 的 具体 运行 线程 
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当选 定 Update Heap 选项 后 ,在 Heap 中 进行 强制 垃圾 回收 (GC) 后 ,可 查看 包 运 行 时 
所 申请 的 堆 大 小 和 利用 率 , 以 及 包 运 行 时 包含 的 不 同 变量 数据 的 申请 次 数 和 占用 的 堆 的 大 
小 情况 。 并 通过 柱状 图 来 清晰 地 显示 自己 关心 的 数据 在 运行 时 占用 堆 大 小 的 次 数 分 布 ,如 


图 5. 22 所 示 。 
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图 5.22 DDMS 调试 具体 变量 的 堆 申请 分 配 详细 信息 


在 Allocation 面板 中 通过 对 运行 进程 进行 空间 申请 跟踪 ,了 解 当 前 进程 包含 变量 的 内 
存 申请 的 次 数 和 所 属 线程 ID 等 一 些 详细 信息 ,如 图 5. 23 所 示 。 


等 Threads 目 Heap 晶 Alocat' 


[Stop Tracking | [Get Allocations Fer Inc. trace 
AllocOrder Allocated Class Thread 1d Allocated in Allocated in 

5 290 byte0 4 org.apache.harmon.. getThreadStats 
6 56 java.nio.ByteArray.. 4 java.nio.ByteBuffer wrap 

14 24 bytel] 4 dalvik.system.Nativ.. run 

12 24 org.apache.harmo.. 4 org.apache harmon-。 dispatch 

10 24 org.apache.harmo.. 4 android.ddm.Ddm.. handleREAQ 
9 24 byte0 4 dalvik.system.Nativ.. run 

7 24 org.apache.harmo.. 4 ‘org.apache.harmon... dispatch 

4 24 org.apache.harmo... 4 android.ddm.Ddm. handleTHST 
3 24 byte0 4 dalviksystem.Nativ.. run 

入 24 org.apacheharmo.. 4 ‘org.apache.harmon... dispatch 

11 17 byte0 4 android.ddm.Ddm... handleREAQ 
13 12 javalanginteger 4 java.lang.Integer valueOf 

8 12 javalanglnteger 4 javaJangInteger valueOf 

2 12 javalang.Integer 4 java.lang.Integer valueOf 


图 5.23 DDMS 进程 申请 空间 信息 跟踪 
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点 拨 DDMS 调试 过 程 中 能 选择 一 个 包 或 多 个 包 进 行 调试 ,并 且 在 调试 中 查看 堆 的 使 
用 状态 时 必须 对 调试 的 包 进 行 垃圾 强制 回收 后 才能 得 到 详细 信息 。 建 议 单个 包 进 行 调试 ， 
这 样 调试 过 程 清晰 简洁 ,可 具有 针对 性 地 改进 程序 。 


5.4.5 使 用 文件 浏览 器 


可 以 使 用 DDMS 来 查看 并 操作 模拟 器 和 设备 上 的 Android 文件 系统 。 表 5. 1 给 出 了 
Android 文件 系统 中 的 一 些 重要 文件 。 


表 5.1 Android 系统 文件 目录 列表 


目 录 说 明 
/data/data/ <package name>/ 应 用 程序 顶层 目录 
/data/data/ <package name> /shared_prefs/ 应 用 程序 共享 首选 项 目录 
/data/data/ <package name> /files/ 应 用 程序 文件 目录 
/data/data/ <package name> /cache/ 应 用 程序 缓存 目录 
/data/data/ <package name> /database/ 应 用 程序 数据 库 目 录 
/sdcard/dowmload/ 用 于 存储 浏览 器 下 载 图 像 
/data/app/ 用 于 存储 第 三 方 Android 程序 文件 


通过 DDMS 浏览 Android 文件 系统 如 图 5. 24 所 示 。 


Name 
vB acd 
b BE cache 
» BS config 


国 defauktprop 
多 dev 

BS ee 

国 fle contets 


多 proc 
property_contexts 
» @ root 
?局 sbn 
B sdeard 
国 seapp_contexts 
sepolioy 
局 sterage 
bss 


Size 


116 


8870 
953 


175260 


919 
2979 
19837 
1795 
3915 


2161 


656 
74708 


Date 
2013-12-09 
2013-12-09 
2013-12-09 
2013-12-09 
2013-12-08 
1969-12-31 
2013-12-09 
2013-12-09 
1969-12-31 
1969-12-31 
1969-12-31 
1969-12-31 
1969-12-31 
1969-12-31 
1969-12-31 
1969-12-31 
2013-12-09 
1969-12-31 
1969-12-31 
2013-07-09 
1969-12-31 
2013-12-09 
1969-12-31 
1969-12-31 
2013-12-09 
2013-12-09 
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5.24 DDMS 文件 浏览 器 查看 虚拟 机 文件 列表 


通过 图 5. 24 你 还 可 以 了 解 到 系统 文件 的 一 些 基本 信息 ,包括 文件 名 称 、 目 录 、 文 件 大 
小 、 创 建 时 间 操作 权限 以 及 简单 描述 信息 。 通 过 文件 浏览 器 可 以 从 模拟 器 或 设备 上 复制 文 
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件 , 向 模拟 器 或 设备 复制 文件 以 及 删除 模拟 器 或 设备 上 的 文件 。 
点 拨 ”通过 文件 浏览 器 可 以 做 到 对 文件 的 删除 操作 ,对 文件 删除 时 要 谨慎 ,删除 后 的 文 
件 没有 办 法 进行 恢复 ,容易 造成 严重 的 错误 ,如 误 删除 系统 重要 文件 。 


5.4.6 模拟 器 控制 


可 以 通过 DDMS 的 Emulator Control 选项 卡 来 操作 模拟 器 的 实例 ,通过 模拟 器 控制 可 
以 做 到 以 下 事情 。 


(1) 修改 通话 状态 ; 
(2) 模拟 语音 通话 ; 
(3) 模拟 SMS 接收 ; 
(4) 发 送 位 置 坐标 。 
模拟 器 控制 面板 如 图 5. 25 所 示 。 


篇 Threads 目 Heap 目 Aloatio.、， 全 Nework.， 韦 FileBplo.. 人 Emulator 5 OSystemIn. © 吕 
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ed 


急 轩 | 邓 目 "加 "= 口 
图 5.25 DDMS 虚拟 机 控制 器 界面 


DDMS 提供 稳定 的 向 模拟 器 发 送 SMS 的 方法 。 要 使 用 模拟 器 控制 标签 模拟 发 送 
SMS ,操作 过 程 如 下 。 

(1) 在 Telephony Actions 中 选 定 SMS; 

(2) 输入 模拟 发 送 的 电话 号 码 , 电 话 号 码 可 以 包含 任意 数字 “十 ”和 ”#”; 

(3) 输入 SMS 消息 ; 

(4) 单 击 Send 按钮 进行 发 送 。 

完成 发 送 后 在 模拟 器 信息 中 会 收 到 模拟 发 送 的 SMS 信息 ,接收 SMS 可 能 存在 中 文 识 
别 问题 。 这 是 需要 注意 的 地 方 。 可 以 通过 图 5. 26 看 到 模拟 器 中 的 短信 接收 界面 。 

点 拨 模拟 机 控制 器 可 以 模拟 SMS 发 送 , 电 话 号 码 没 有 具体 的 限制 ,可 以 通过 错误 号 
码 来 检测 开发 程序 的 正确 性 。 还 可 以 通过 SMS 中 发 送 中 文 来 检测 程序 的 兼容 性 。 
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图 5.26 虚拟 机 接收 DDMS 模拟 发 送 的 信息 


5.4.7 应 用 程序 日 志 


Samd Ries ~ Bh | TREE es | 日 忆 加 


图 5.27 LogCat 日 志 信息 显示 


还 可 以 创建 自 定义 过 滤 标 签 来 显示 仅 与 调试 标记 相关 的 日 志 信 息 。 可 以 通过 “十 ”按钮 
来 添加 过 滤 标 签 ,这 对 应 用 程序 调试 过 程 相当 有 帮助 ,只 显示 相关 的 日 志 活 动 。 

在 调试 过 程 中 还 可 以 通过 DDMS 进行 截取 模拟 器 或 设备 的 屏幕 显示 。 设 备 截屏 对 于 
调试 来 讲 非 常 有 用 。 

截取 屏幕 显示 可 以 通过 DDMS 中 的 Screen Capture 来 进行 屏幕 截取 , 单 击 后 会 出 现 截 
取 界 面 , 当 显示 后 查看 是 否 为 想 截 取 的 界面 ,确认 后 通过 Save 来 保存 截取 的 屏幕 画面 。 
DDMS 屏幕 画面 截图 功能 如 图 5. 28 所 示 。 
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5.28 DDMS 截图 操作 效果 


小 结 


本 章 相对 来 说 具有 很 强 的 操作 性 ,从 Dalvik 虚拟 机 的 工具 介绍 ,我 们 看 到 了 Dalvik 虚 
拟 机 在 程序 开发 过 程 中 的 调试 分 析 作 用 ,通过 工具 的 使 用 对 虚拟 机 内 部 的 实现 机 制 更 加 清 
晰 ,了 解 了 如 何 对 Android 程序 源码 进行 调试 分 析 内 存 泄漏 ,如 何 对 Android 程序 运行 过 程 
中 生成 的 trace 文件 进行 分 析 , 如 何 使 用 DDMS 工具 对 程序 源码 进行 准确 的 跟踪 调试 分 析 。 
对 于 大 多 数 从 事 Android 程序 开发 的 程序 员 来 说 ,熟练 运用 这 些 工 具 , 分 析 Android 程序 源 
码 将 变 得 得 心 应 手 ,内 存 泄漏 作为 常常 被 程序 员 在 编码 过 程 中 忽略 的 问题 ,资源 使 用 后 未 释 
放 , 有 时 候 只 有 当 程序 大 量 消耗 内 存 卡 死 的 时 候 才 体现 出 来 ,通过 对 堆栈 和 程序 运行 过 程 中 
trace 文件 进行 分 析 , 可 以 准确 定位 程序 中 源码 语句 ,有 效 地 提高 程 率 。 通过 
DDMS 工具 可 以 详细 地 调试 开发 程序 在 内 存 使 用 方面 的 信息 ,可 以 通过 这 些 信息 进一步 优 
化 程序 ,有 助 于 开发 高 效 的 应 用 程序 。 


此 
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第 6 音 
Dalvik 虚 拟 机 执行 流程 详解 


本 章 主要 内 容 

名 什么 是 Dalvik 虚拟 机 ? 

避 Dalvik 虚拟 机 包含 哪些 功能 模块 ? 

名 Dalvik 虚拟 机 在 不 同 平台 运行 时 从 何 开 始 ? 

加 Zygote 机 制 是 如 何 实现 的 ? 

名 Zygote 机 制 在 Dalvik 虚拟 机 中 充当 怎样 的 角色 ? 

吕 Dalvik 虚拟 机 启动 流程 是 怎样 的 ? 

Dalvik 虚拟 机 作为 Android 运行 环境 的 核心 组 成 ,在 其 执行 过 程 中 需要 各 个 模块 的 协 
调配 合 。 本 章 简要 介绍 了 Dalvik 虚拟 机 的 作用 及 组 成 ,从 Dalvik 虚拟 机 运行 流程 着 手 ,分 
析 Dalvik 虚拟 机 运行 在 不 同 平台 的 启动 过 程 ,着 重 分 析 了 Dalvik 虚拟 机 中 必 不 可 少 的 线程 
管理 机 制 一 一 Zygote 机 制 ,剖析 了 Zygote 在 Dalvik 虚拟 机 运行 时 所 发 挥 的 作用 及 其 主要 
实现 。 对 Dalvik 虚拟 机 中 运行 的 apk 文件 的 生成 过 程 进行 了 说 明 。 最 后 ,以 运行 应 用 程序 
为 例 ,验证 Dalvik 虚拟 机 中 各 个 模块 的 主要 作用 及 相互 关系 ,从 全 局 的 角度 展示 了 Dalvik 
虚拟 机 的 执行 流程 。 


6.1 本 章 概述 


Dalvik 虚拟 机 是 Android 中 Java 程序 的 运行 基础 。 它 是 针对 低 内 存 的 设备 对 Java 虚 
拟 机 的 优化 ,允许 在 同一 台 设备 上 一 次 运行 多 个 虚拟 机 实例 。 每 一 个 Android 应 用 在 底层 
都 会 对 应 一 个 独立 的 Dalvik 虚拟 机 实例 ,其 代码 在 虚拟 机 的 解释 下 得 以 执行 。Dalvik 虚拟 
机 较 接 近 底层 的 Linux 操作 系统 ,并 且 依 赖 其 线程 .内 存 等 管理 机 制 ,可 以 高 效 地 利用 内 存 ， 
并 能 在 移动 设备 等 这 样 低速 的 CPU 上 表现 出 较 高 的 性 能 。 

Java 应 用 程序 转换 为 Dex 文件 后 即 可 在 Dalvik 虚拟 机 中 执行 。Dex 文件 是 Dalvik 虚 
拟 机 中 专 有 的 可 执行 文件 格式 , 它 整 合 优化 了 class 文件 ,更 适合 于 移动 设备 。Dalvik 虚拟 
机 按照 各 部 分 的 功能 可 以 分 为 : 线程 管理 .类 加 载 . 解 释 器 、 内 存 管理 、 即 时 编译 .本 地 方法 
调用 、 反 射 机 制 、 调 试 支撑 几 个 部 分 。 

线程 管理 : 进程 隔离 和 线程 管理 ,每 一 个 Android 应 用 在 底层 都 会 对 应 一 个 独立 的 
Dalvik 虚拟 机 实例 ,所 有 的 Android 应 用 的 线程 都 对 应 一 个 Linux 线程 ,进程 管理 依赖 于 
Zygote 机 制 。 

类 加 载 : 解析 Dex 文件 并 加 载 Dalvik 字 节 码 。 

解释 器 : 根据 自身 的 指令 集 Dalvik ByteCode 解释 字 节 码 。 
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内 存 管 理 : 分 配 系统 启动 初始 化 和 应 用 程序 运行 时 需要 的 内 存 资源 。 

即时 编译 (Just-In-Time.JIT) : 在 解释 时 动态 地 编译 程序 ,以 缓解 解释 器 的 低 效 工作 。 

本 地 方法 调用 (Java Native Interface,JND : 一 套 编程 框架 标准 接口 ,允许 Java 代码 和 
本 地 代码 互相 调用 。 

反射 机 制 实现 模块 : 允许 程序 在 运行 时 透 过 Reflection API 取得 任何 一 个 已 知名 称 的 
类 的 内 部 信息 ,包括 其 描述 符 、 超 类 、 实 现 的 接口 ,也 包括 属性 和 方法 等 所 有 信息 ,并 可 于 运 
行 时 改变 属性 内 容 或 调用 内 部 方法 。 

调试 支撑 模块 : Dalvik VM 支持 许多 常见 开发 环境 下 的 代码 级 调试 ,任何 允许 JDWP 
下 远程 调试 的 工具 都 可 以 使 用 ,其 支持 的 调试 器 包括 jdb、Eclipse、Intelli] 和 JSwat。 

应 用 程序 封装 到 Dex 文件 后 ,通过 Zygote 机 制 为 其 创建 新 的 虚拟 机 ,调用 类 加 载 将 程 
序 加 载 到 Dalvik 虚拟 机 中 ,在 内 存 管理 等 模块 的 配合 下 由 解释 器 进行 取 指 执行 。 各 个 模块 
具体 分 析 详 见 相应 章节 。 


6.2 Dalvik 虚拟 机 的 入 口 点 介绍 


在 Dalvik 虚拟 机 中 ,每 一 个 应 用 程序 均 对 应 一 个 虚拟 机 实例 ,因而 在 运行 应 用 程序 之 
前 需要 创建 虚拟 机 ,由 虚拟 机 负责 应 用 程序 的 运行 。 在 Android 中 ,Dalvik 虚拟 机 既 可 以 在 
x86 平台 上 作为 应 用 程序 运行 ,也 可 以 在 手机 等 移动 设备 的 ARM 平台 上 运行 ,在 不 同 平台 
运行 时 ,虚拟 机 的 人口 点 略 有 不 同 , 以 下 主要 分 析 Dalvik 虚拟 机 这 两 种 运行 方式 的 入 口 点 。 


6.2.1 Dalvik 虚拟 机 在 x86 平台 运行 的 入 口 点 


将 Dalvik 虚拟 机 作为 应 用 程序 运行 在 x86 平台 时 ,通过 调用 main 函数 启动 。 其 main 
函数 在 Dalvik 虚拟 机 源码 目录 dalvik/dalvikvm/Main. c 文件 中 ,是 Dalvik 虚拟 机 作为 
Linux 下 x86 应 用 程序 运行 时 的 和 人口。 在 其 中 调用 JNL_CreateJavaVM() 函数 来 创建 虚拟 
机 。 主 要 代码 如 下 。 

代码 清单 6.1 dalvik/dalvikvm/Main. c: main() 源 代码 


int main (int argc, char* oonst argv[]){ 
JavaM* wre NULL; 
UNIEnvx erv=NILL; 
JavaWMInitArgs initArgs; 
Ax 启 动 虚拟 机 。 当 前 线程 成 为 主线 程 的 虚拟 机 。* / 
if ONI_ CreateJavaM(&wm, genv, &initArgs) <0) { 
fprintf (stderr, "Dalvik WM init failed (check log file) \n"); 
goto bail; 
} 
Dalvik 虚拟 机 作为 Linux 下 x86 应 用 程序 运行 ,主要 是 用 于 开发 和 调试 使 用 。 我 们 知 
道 ,在 一 个 资源 有 限 的 平台 里 ,如 手机 等 移动 设备 ,进行 开发 和 调试 ,都 是 一 件 不 容易 的 事 
情 ,需要 花费 很 多 时 间 。 而 利用 目前 x86 的 平台 ,可 以 使 用 x86 大 量 的 工具 和 资源 ,可 以 很 
大 程度 上 提高 开发 效率 ,同时 也 使 调试 功能 更 加 容易 。 在 Dalvik 虚拟 机 进行 开发 新 功能 
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时 ,可 以 先 在 x86 的 平台 上 运行 和 调试 通过 ,然后 再 编译 在 ARM 平台 运行 。 当 Dalvik 虚 
拟 机 运行 在 手机 平台 时 , 它 的 入 口 点 并 不 是 从 该 main 函数 开始 。 


6.2.2 Dalvik 虚拟 机 运行 在 ARM 平台 的 入 口 点 


Dalvik 虚拟 机 运行 在 ARM 平台 时 ,是 从 初始 化 进程 加 载 的 服务 Zygote 开始 的 。 
Zygote 进程 介绍 见 6. 3 节 。 

Zygote 进程 通过 调用 startVm 来 创建 虚拟 机 。 在 这 个 函数 中 主要 通过 调用 JNI_ 
CreateJavaVM() 来 创建 虚拟 机 。 主 要 代码 如 下 。 

代码 清单 6.2 android/frameworks/base/core/jni/ AndroidRuntime. cpp: startVm() 
源 代码 


证 ONIT CreateJavaVM(pJavaVM FEnv, &initArgs) <0) { 
IOGE (ONT CreateJavaVM failed\n"); 
goto bail; 


Dalvik 虚拟 机 的 两 个 人 口 点 最 后 均 通 过 调用 JNI_CreateJavaVM() 函 数 来 完成 虚拟 机 
的 创建 。JNI_CreateJavaVM 所 完成 的 主要 工作 如 下 。 

(1) 检查 JNI 版 本 是 否 正确 ; 

(2) 解析 命令 行 参数 ,初始 化 JNIEnv 和 JavaVM 全 局 变量 ; 

(3) 初始 化 全 局 变量 gDvm; 

(4) 调用 dvmStartup 初始 化 虚拟 机 的 各 个 模块 ,包括 初始 化 垃圾 收集 器 、 类 加 载 器 、 字 
节 码 校 验 模块 和 解释 器 等 ,完成 各 模块 的 初始 化 后 创建 一 个 线程 ; 

(5) 装载 Dalvik 虚拟 机 运行 时 核心 类 库 并 校 验 字 节 码 。 

JNI CreatejJavaVM 函数 的 实现 在 文件 dalvik/vm/Jni.c 里 。 主 要 代码 如 下 。 

代码 清单 6.3 dalvik/vmy/Jni. c: JNL CreateJavaVM() 源 代码 


jint UNT_CreateJavaVM(OavaVMx * p vm, UNIEnvx * p env, voidx wm args) { 
Const JavaMInitArgs* args= (JavaMInitArgs* ) wm args; 


Ax 初 始 化 Wa. * / 
std::string status— 
GumStartiup (argc, argv.get(), args-— > ignoreUnreoogized, (JNIFEnv* )pErv); 
if (!status.enpty()) { 
free (Env) 7 
free (GM) ; 
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IOGW("createJavaVM failed: $3", status.c str()); 
reimn NI FRR; 

} 

xx 成 功 ! Retum stuff to caller.*/ 

dmChangeStatus (NULL, THREAD NATIVE); 

* p_env= (JNIEnv* ) penv; 

* 了 we (JavaM* ) BM; 

IDGV ("CreateJavaWM sucoseded") ; 

retum JUNT OK; 

} 


如 代码 所 示 ,JNI_CreateJavaVM() 函 数 通过 调用 dvmStartup 函数 完成 虚拟 机 的 初 
始 化 。 


6.2.3 Dalvik 虚拟 机 的 初始 化 


在 不 同 平台 运行 的 Dalvik 虚拟 机 ,其 入 口 点 虽 不 同 ,但 它 的 初始 化 均 调用 dvmStartup 
函数 来 完成 ,如 图 6. 1 所 示 , 在 这 个 函数 中 ,Dalvik 虚拟 机 中 各 个 模块 进行 了 初始 化 。 
创建 虚拟 机 
JNI CreateJavaVM 
初始 化 
dvmStartup 
| 
| ! | | | | | 


线程 管理 | | 类 加 载 | | 解释 器 | | 内 存 管理 (分 配 内 | | 即时 编译 | | 本 地 方法 调用 | | 反射 机 制 实现 | | 调试 支撑 
存 、 垃 圾 回收 ) 


图 6.1 Dalvik 虚拟 机 的 初始 化 模块 图 


6.3 Zygote 进程 


Zygote 是 Android 系统 应 用 中 一 个 相当 重要 的 进程 ,所 有 运行 应 用 程序 的 虚拟 机 进程 
都 是 由 Zygote 创建 的 。Zygote 本 身 是 一 个 Native( 人 参见 JNI 本 地 调用 机 制 ) 的 应 用 进程 ， 
与 驱动 ,内核 等 均 无 关系 。Zygote 进程 是 由 init 进程 根据 system/core/rootdir/init. rc 文件 
中 的 配置 项 创建 的 ,init 进程 是 系统 启动 后 运行 在 用 户 空间 的 首 个 进程 。init 进程 启动 完 系 
统 运 行 所 需 的 各 种 Daemon 线程 (Java 将 线程 分 为 User 线程 和 Daemon 线程 两 种 ,其 中 
Daemon 线程 即 守 护 线程 ,运行 在 程序 后 台 , 用 来 为 User 线程 提供 某 些 服务 ) 后 ,启动 
Zygote 进程 。Zygote 进程 启动 后 .Android 的 应 用 程序 都 由 Zygote 进程 启动 运行 。Zygote 
主要 负责 : 

(1) 启动 系统 服务 SystemServer 进程 ; 

(2) 创建 子 进程 运行 Android 应 用 程序 。 

通过 复制 自身 快速 提供 虚拟 机 实例 来 执行 Android 应 用 程序 ,Zygote 进程 能 为 应 用 程 
序 提供 一 个 高 效 的 运行 环境 ,在 应 用 程序 运行 时 ,有 效 地 减少 系统 负担 ,提高 设备 的 利用 率 ， 
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加 长 设备 的 使 用 时 间 ,使 得 应 用 程序 在 有 限 的 资源 下 有 更 快 的 运行 响应 速度 。 

Zygote 是 Android 系统 的 主要 特征 , 它 通 过 COW (copy_on_write) 方 式 对 运行 在 内 存 
中 的 进程 实现 了 最 大 程度 的 复 用 ,并 通过 库 共享 有 效 地 降低 了 内 存 的 使 用 量 。 一 般 说 来 , 复 
制 内 存 的 开销 非常 大 ,因此 创建 的 Zygote 子 进程 直接 共享 父 进程 的 内 存 空间 ,而 当 需 要 修 
改 共享 内 存 中 的 信息 时 , 子 进程 才 会 将 父 进 程 中 的 相关 内 存 信 息 复制 到 自身 的 内 存 空间 ,并 
进行 修改 ,这 就 是 COW 技术 。 

Dalvik 虚拟 机 中 Zygote 主要 负责 线程 管理 ,与 其 他 模块 之 间 的 关系 如 图 6.2 所 示 ( 注 : 
图 中 较 细 的 箭头 代表 流程 , 较 粗 的 箭头 代表 依赖 关系 ,下 文 图 中 的 箭头 与 此 规定 相同 ) 。 


Zygote 进 程 


创建 虚拟 机 调用 
JNIL CreateJavaVM 


运行 Android 所 LL 
应 月 


内 存 管理 (垃圾 回收 ) 


图 6.2 Zygote 与 其 他 模块 关系 


在 Android 中 ,每 个 应 用 程序 运行 在 各 自 的 Dalvik 虚拟 机 实例 中 ,每 一 个 虚拟 机 实例 
都 是 一 个 独立 的 进程 空间 。Android 应 用 程序 运行 在 各 自 独 立 的 进程 空间 由 各 自 的 用 户 控 
制 , 可 以 最 大 程度 确保 应 用 的 安全 和 运行 的 独立 性 。 

Zygote 是 一 个 虚拟 机 进程 ,也 是 虚拟 机 实例 的 几 化 器 。 它 在 系统 启动 时 产生 ,完成 虚 
拟 机 的 初始 化 , 库 的 加 载 ,预制 类 库 和 初始 化 等 操作 。 每 当 系 统 要 求 执行 一 个 Android 应 用 
程序 ,Zygote 就 会 fork 出 一 个 子 进程 来 执行 该 应 用 程序 。Zygote 首先 会 孵化 出 system_ 
server 进程 (Android 绝 大 多 系统 服务 的 守护 进程 , 它 会 监听 socket 等 待 请 求 命令 ), 当 系统 
需要 一 个 新 的 虚拟 机 实例 时 ,Zygote 会 迅速 复制 自身 ,以 最 快 的 速度 提供 给 系统 。 对 于 一 
些 只 读 的 系统 库 , 所 有 虚拟 机 实例 都 和 Zygote 共享 一 块 内 存 区 域 .可 以 有 效 地 节省 内 存 开 
销 。Zygote 与 其 创建 的 子 进程 之 间 资 源 共 享 关系 ,如 图 6. 3 所 示 。 

点 拨 ”Zygote 进程 运行 时 ,会 初始 化 Dalvik 虚拟 机 ,并 启动 它 。Android 应 用 程序 是 
由 Java 编写 的 ,它们 不 能 直接 以 本 地 进程 的 形态 运行 在 Linux 上 ,只 能 运行 在 Dalvik 虚拟 
机 中 。 并 且 , 每 个 应 用 程序 都 运行 在 各 自 的 虚拟 机 中 ,应 用 程序 每 次 运行 都 要 重新 初始 化 并 
启动 虚拟 机 ,这 个 过 程 会 耗费 相当 长 时 间 , 是 拖 慢 应 用 程序 的 原因 之 一 。 因 此 ,在 Android 
中 ,应 用 程序 运行 前 ,Zygote 进程 通过 共享 已 运行 的 虚拟 机 的 代码 与 内 存 信息 ,缩短 应 用 程 
序 运行 所 耗费 的 时 间 。Zygote 进程 启动 时 先 将 应 用 程序 要 使 用 的 Android Framework 中 
的 类 与 资源 加 载 到 内 存 中 ,并 组 织 形成 所 用 资源 的 链接 信息 。 新 运行 的 Android 应 用 程序 
在 使 用 所 需 资 源 时 不 必 每 次 重新 形成 资源 的 链接 信息 ,这 会 节省 大 量 时 间 , 提 高 程序 运行 
速度 。 

Zygote 启动 后 ,会 初始 化 并 运行 Dalvik 虚拟 机 ,而 后 将 需要 的 类 与 资源 加 载 到 内 存 中 。 
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一 SystemServer 进 程 | 
| 1 (进程 私有 类 和 资源 】 | 
1 1 
1 
ER 二 区 共享 Zygote 的 类 与 ”|! 
Zygote 进 各 | 的 连接 信息 
Socket 监 听 服 务 


共享 Zygote 的 类 与 
资源 的 连接 信息 


1 

| 

1 [已 加 载 的 Android application 
| framework 使 用 的 类 和 资源 
| 

| 

| 

1 


共享 Zygote 的 类 与 
资源 的 连接 信息 


图 6.3 Zygote 进程 创建 子 进程 的 内 存 共享 示意 图 


当 接 收 到 应 用 程序 A 的 启动 请 求 时 ,Zygote 调用 fork() 创 建 出 zygote’ 子 进程 ,接着 
Zygote’ 子 进程 动态 加 载 并 运行 Android 应 用 程序 A; 运 行 应 用 程序 A 时 ,会 使 用 Zygote 已 
经 初始 化 并 启动 运行 的 Dalvik 虚拟 机 代码 ,通过 使 用 已 加 载 至 内 存 中 的 类 与 资源 来 加 快运 
行 速度 。 

由 此 ,Zygote 工作 流程 如 下 。 

(1) 系统 init 进程 创建 Zygote 进程 ,通过 执行 app_process 程序 ,开启 Zygote 进程 。 

(2) app_process 生成 AppRuntime 对 象 ,分 析 其 主 函 数 传递 过 来 的 参数 ,传递 给 
AppRuntime 对 象 , 调 用 对 象 的 start 方法 ,在 start 中 完成 了 以 下 三 件 事 。 

J@ 调用 startVm 注册 虚拟 机 。 在 其 中 通过 调用 JNL_CreateJavaVM() 创 建 虚拟 机 。 

@ 调用 startReg 注册 JNI 函数 。 注 册 虚 拟 机 要 使 用 的 JNI 函数 ,这 样 运行 在 虚拟 机 中 
的 Java 类 就 可 以 调用 本 地 函数 了 。 执行 app_process 程 序 

@ 调用 ZygoteInit 类 的 main 函数 ,运行 
ZygoteInit 类 (位 于 framework/base/core/java/ 
com/androld/internal/os/ZygoteLnit. java) 。 

如 图 6.4 所 示 init 进程 启动 Zygote 进程 。 

(3) ZygoteInit 是 Zygote 的 main 函数 入 
口 ,是 Zygote 的 核心 类 ,完成 了 Zygote 的 职 
责 , 其 执行 流程 如 下 。 

O@ 调用 registerZygoteSocket 函数 创建 了 图 6.4 启动 Zygote 进程 流程 图 
一 个 socket 接口 , 绑 定 socket 套 接 字 ,接受 新 


@ 调用 preloadClasses 和 preloadResource 函数 加 载 Android application framework 
使 用 的 类 和 资源 。 
@ 调用 startSystemServer 图 数 来 启动 SystemServer 组 件 。 在 startSystemServer 中 
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调用 forkSystemServer() 来 分 裂 出 一 个 名 为 “system_server” 的 进程 (这 个 过 程 在 虚拟 机 中 
实现 ) ,这 个 进程 最 终 会 调用 com. android. server. SystemServer 的 main 函数 ,启动 各 项 系 
统 服务 ,并 最 终 将 调用 线程 加 入 到 Binder 通信 系统 。system_server 是 系统 Service 所 驻 留 
的 进程 ,该 进程 是 framework 的 核心 ,一 旦 system_server 进程 退出 ,就 会 导致 Zygote 退出 
并 重启 。 

@ Zygote 从 startSystemServer 函数 返回 后 ,最 终 调用 runSelectLoopMode 函数 进入 
一 个 无 限 循环 ,监听 socket 接口 等 待 新 的 应 用 程序 请 求 。 当 新 的 应 用 程序 请 求 到 来 时 ,在 
runSelectLoopMode 中 会 接收 连接 的 对 象 ZygoteConnection(ZygoteConnection 是 用 来 进 
行 套 接口 连接 管理 及 其 参数 解析 ,其 他 Actvitiy 建立 进程 请 求 是 通过 套 接口 发 送 命 令 参数 
给 Zygote) ,通过 调用 ZygoteConnection 的 runOnce() 函 数 来 运行 应 用 程序 。 在 runOnce() 
中 读 取 system_server 发 送 过 来 的 参数 ,调用 Dalvik 虚拟 机 中 的 forkAndSpecialize() 函 数 
创建 一 个 子 进 程 用 于 运行 应 用 程序 , 当 应 用 程序 运行 完毕 后 , 子 进 程 退出 。Zygote 继续 监 
听 等 待 新 的 应 用 程序 请 求 。 

图 6. 5 表示 ZygoteInit 执行 过 程 。 


Zygotelnit::main() 


( 鱼 定 socket 春 接 字 .接受 新 的 Android 应 用 程序 运行 请 求 ) ) 
registerZygoteSocket() 
( 加 载 Android application framework 使 用 的 类 和 资源 ] 


preloadClasses();preloadResources() 


启动 运行 SystemServer 


startSystemServer() 


( 处理 新 的 Android 应 用 程序 运行 请 求 ) 
\ runSelectLoopMode() 


图 6.5 ZygoteInit:main 方法 功能 实现 图 


在 Dalvik 虚拟 机 中 ,Zygote 除了 可 以 创建 上 述 的 system_server 子 进 程 外 ,还 可 以 创建 
另 两 种 进程 ,其 创建 三 种 进程 的 方式 可 用 图 6. 6 来 描述 。 


forkSystemSever 


Zygote 
System_Server 
forkAndSpecialize 进程 
forkSystemSever 
Zygote 


图 6.6 Zygote 分 裂 图 


forkAndSpecialize 


非 Zygote 
子 进程 


ZLygote 
子 进程 


System_server 


点 拨 在 Dalvik 虚拟 机 中 ,Zygote 提供 访问 Dalvik 虚拟 机 的 Zygote 接口 , 它 包 装 了 
Linux 系统 的 fork 函数 ,用 于 建立 一 个 新 的 虚拟 机 实例 进程 。Socket 套 接 字 相关 内 容 可 查 
看 Java 进程 通信 相关 知识 。Android 中 有 许多 相关 的 系统 服务 进程 ,这 点 在 相关 Android 
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系统 的 书 中 均 有 介绍 , 故 不 再 黄 述 。 


在 Dalvik 虚拟 机 中 ,Zygote 机 制 的 三 种 创建 进程 的 方法 根据 JNI 机 制 均 对 应 到 一 个 本 
地 方法 ,位 于 dalvik/vm/native/dalvik_system_Zygote. cpp 文件 中 ,三 个 创建 进程 的 静态 方 


法 分 别 如 下 。 


(1) fork() ,创建 一 个 Zygote 进程 ,其 实现 对 应 的 函数 为 Dalvik_dalvik_system_Zygote_ 


fork() ,代码 如 下 。 


代码 清单 6.4 dalvik/vm/native/dalvik_system_Zygote. cpp: Dalvik_dalvik_system_ 


Zygote_fork() 源 代码 


Static void Dalvik dalvik system Zygote fork(const u4* args, Walue* FEesult) 


{ 


pid t pid; 
A* 判 断 当前 虚拟 机 是 否 支 持 zygptex / 
if (!gpum.zygote) { 
dmtrhrowI]legalStatePxcepticn( 
"WM instance not started with - Xzygote"); 
RETURN VOID(); 
} 
Asx 判 断 堆 创建 是 否 成 功 * / 
if (!dumGcPrezygoteFork()) { 
IOGE (pre fork heap failed"); 
Ax 不 成 功 ,停止 虚拟 机 * / 
dmabort (); 
}Ax 设 置信 号 机 制 * / 
setSignalHandler (); 
Ax 记 录 日 志 信 息 * / 
dumDumpLoaderStats ("zygote"); 
pid- fork(); 


# ifdef HAVE ANCROID OS 


if (pid-=0) { 
/* childprooess * / 
Asx 子 进程 * / 
allocleakZygoteChild= 1; 
} 


#endif 


' 


fork() 方 法 会 重新 产生 一 个 新 Zygote 进程 ,新 的 子 进程 复制 了 父亲 进程 的 资源 ,包括 
内 存 的 内 容 、task_struct 内 容 , 在 复制 过 程 中 , 子 进程 复制 了 父 进 程 的 task_struct、 系 统 堆 


PETURN_INT (pid) ; 
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栈 空间 和 页 面 表 , 而 当 子 进程 改变 了 父 进 程 的 变量 的 时 候 , 会 通过 写 时 复制 (copy_on_ 
write) 的 手段 为 所 涉及 的 页 面 建立 一 个 新 的 副本 ,新 的 Zygote 进程 可 以 再 产生 子 进程 。 

点 拨 ”fork() 函 数 通 过 系统 调用 创建 一 个 与 原来 进程 几乎 完全 相同 的 进程 ,也 就 是 两 
个 进程 可 以 做 完全 相同 的 事 , 但 如 果 初 始 参数 或 者 传 入 的 变量 不 同 , 两 个 进程 也 可 以 做 不 同 
的 事 。 一 个 进程 调用 fork() 函 数 后 ,系统 先 给 新 的 进程 分 配 资源 ,例如 存储 数据 和 代码 的 空 
间 。 然 后 把 原来 的 进程 的 所 有 值 都 复制 到 新 的 进程 中 ,只 有 少数 值 与 原来 的 进程 的 值 不 同 。 
相当 于 克隆 了 一 个 自己 。 

Dalvik_dalvik_system_Zygote_fork() 函 数 执行 流程 如 图 6.7 所 示 。 


抛 出 异常 “虚拟 机 实 
例 未 启动 Zygote” 
并 返回 空 
输出 失败 信息 
停止 虚拟 机 
设置 信号 量 机 制 
将 虚拟 机 的 Zygote 调 用 状 
态 统计 信息 写 入 日 志文 件 
调用 fork() 创 建 进程 ， 
返回 pid 
处 于 子 进程 设 
置 子 进程 参数 
pid 存 入 虚拟 机 相 
关 参 数 ， 返 回 空 


图 6.7 ”Dalvik_dalvik_system_Zygote_fork() 函数 流程 图 


在 Dalvik_dalvik_system_Zygote_fork() 函数 中 直接 调用 了 fork() 产 生 新 的 Zygote 进 
程 ,新 进程 复制 父 进 程 的 资源 ,新 的 Zygote 进程 的 虚拟 机 参数 中 支持 Zygote 标记 参数 
gDvm. zygote 也 为 true, 因 而 可 以 再 次 产生 出 子 进程 。 

在 函数 中 调用 了 一 次 fork() 函 数 , 得 到 的 返回 值 pid 有 三 个 ,这 是 因为 : 在 fork 函数 
执行 完毕 后 ,如 果 创 建新 进程 成 功 , 则 出 现 两 个 进程 ,一 个 是 子 进程 .一 个 是 父 进程 。 在 
子 进程 中 ,fork 函数 返回 0, 在 父 进程 中 ,fork 返回 新 创建 子 进程 的 进程 ID; 如 果 创 建 失败 
则 返回 负 值 。 通 过 fork 的 返回 值 可 以 判断 进程 创建 是 否 成 功 以 及 当前 进程 是 子 进程 还 
是 父 进程 。 
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(2) forkSystemServer() ,创建 一 个 系统 服务 进程 ,其 实现 对 应 的 函数 是 Dalvik_dalvik_ 
system_Zygote_forkSystemServer() ,代码 如 下 。 

代码 清单 6.5 dalvik/vm/native/dalvik_system_Zygote. cpp: Dalvik_dalvik_system_ 
Zygote_forkSystemServer() 源 代码 


static void Dalvik dalvik system Zygote forkSystemServer( 
const u4* args, Walue* FpResult) 


pid t pid; 
Ax 根 据 参 数 ,fork 一 个 子 进程 * / 
Pid= forkmndspecializeCommon (args, true); 


/x*2Zygpte 进程 检查 子 进程 是 否 已 经 死 掉 * / 
if (pic>0) { 
int status; 
IOGI ("System server Process $d has been created", pid); 
nx 保存 system server 的 进程 iax / 
/x 在 这 里 ,如果 system server 进 程 已 经 崩溃 ,但 是 它 并 不 能 引起 注意 ,因为 还 没 
* 有 公布 它 的 pid, 因 此 ,这 里 检查 system server 是 否 退 出 ,是 为 了 确保 准确 。 
bu 
if (waitpid(pid, &status, WNOHANS)==pid) { 
xx 如果 system server 退 出 了 ,2Zygote 直接 Kii 掉 自己 */ 
IOGE ("System server prooess %d has died. Restarting Zygote!", pid); 
Kill (getpid(), SIGKILD); 


Yh 
FETURN_INT (pid); 

} 

forkSystemServer( ) 的 子 进程 不 是 Zygote 进程 .调用 forkSystemServer() 创 建 的 
system_server 子 进程 会 一 直 驻 留 在 系统 中 ,一 旦 此 进程 退出 , 父 进程 Zygote 也 会 被 终止 。 
系统 init 进程 通过 重启 Zygote 进程 ,使 得 Zygote 进程 重新 启动 system_server 进程 。 

在 ZygoteInit 中 使 用 startSystemServer() 来 启动 系统 服务 , startSystemServer() 方 法 
通过 调用 Dalvik 虚拟 机 的 dalvik_system_Zygote. cpp 文件 中 的 forkSystemServer() 方 法 来 
fork “system_server” 进 程 。 与 创建 运行 普通 Android 应 用 程序 的 进程 不 同 , system_server 
是 必须 运行 的 ,因此 在 forkSystemServer() 方 法 中 必须 检查 生成 的 system_server 进程 是 否 
退出 。 

函数 流程 如 图 6. 8 所 示 。 

当 Zygote 创建 system_server 后 ,在 函数 结束 之 前 需要 检查 system_server 进程 是 否 退 
出 ,车 发 现 其 退出 ,Zygote 就 会 kill 自身 ,由 此 可 见 Zygote 与 system_server 之 间 的 密切 
关系 。 
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开始 


根据 输入 参数 调用 
forkAndSpecializeCommon() 
创建 system_server 子 进程 ， 


得 到 其 返回 的 进程 pid 
是 输出 system_server 进 程 创建 成 功 
> 日 志 信息 ， 保 存 进程 pid 到 虚拟 机 
全 局 变量 systemServerPid 中 


否 Rs 
pid 存 入 虚拟 机 相 |_ 否 退出 的 进程 是 


输出 systemserver 进 程 退出 
信息 ，kill 掉 Zygote 进 程 


ee 
识 
油 


图 6.8 Dalvik_dalvik_system_Zygote_forkSystemServer() 函数 流程 图 


(3) forkAndSpecialize() ,创建 一 个 非 Zygote 进程 ,其 实现 对 应 的 函数 为 Dalvik_dalvik 
_system_Zygote_forkAndSpecialize() ,代码 如 下 。 

代码 清单 6.6 dalvik/vm/native/dalvik_system_Zygote. cpp: Dalvik_dalvik_system_ 
Zygote_forkAndSpecialize() 源 代码 


static void Dalvik dalvik system Zygote forkandspecialize (const u4x args, 
Walue* pResult) 


pid t pid; 
pid= forkAndSpecializeCamon (args, false); 
FETURN INT (pid); 

} 


forkAndSpecialize() 不 同 于 fork(), 它 产生 的 子 进程 不 是 Zygote 进程 ,也 就 是 说 它 的 


子 进程 不 会 产生 新 进程 。 
Dalvik_dalvik_system_Zygote_forkAndSpecialize( ) 函 数 流 程 如 图 6.9 所 示 。 


1 
调用 forkAndSpecializeCommon() 函 数 
创建 进程 ,得 到 其 返回 的 进程 pid 


1 
pid 存 人 虚拟 机 相 
关 参 数 ,返回 空 


结束 


图 6.9 Dalvik_dalvik_system_Zygote_forkAndSpecialize() 函 数 流程 图 
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函数 调用 forkAndSpecializeCommon() 函数 来 产生 新 进程 ,而 在 forkSystemServer() 函 
数 中 也 调用 了 此 函数 来 产生 system _ server 进程 ,不 同 的 是 传递 的 参数 不 相同 ， 
forkAndSpecializeCommon() 函 数 的 第 二 个 参数 即 标识 创建 的 子 进程 是 否 为 system_server 
子 进程 ,forkSystemServer() 调 用 时 第 二 个 参数 为 true, 而 forkAndSpecialize() 调 用 时 则 为 
false。 

在 Dalvik_dalvik_system_Zygote_forkSystemServer() 函 数 和 Dalvik_dalvik_system_ 
Zygote_forkAndSpecialize() 函 数 中 均 调 用 了 forkAndSpecializeCommon() 函 数 来 实现 产生 
新 进程 返回 进程 id, 其 代码 如 下 。 

代码 清单 6.7 dalvik/vm/native/dalvik_system_Zygote. cpp: forkAndSpecializeCommon () 
源 代码 


static pid t forkRndspecializeCommcn (const uA* args, bool isSystemServer) 
{ 
pid t pid; 
uid t uid= (uid t) args[0]; 
gid t gid (gid t) args[1]; 
RrrayCbject* gids= (ArrayCbject * )args[2]; 
u4 debugFlags= args[3]; 
PrrayCbject * rlimits= (ArrayCbject * )args[4]; 
int64 t permittedCapabilities, effectiveCapabilities; 
/Ax 判断 是 否 为 system server 进 程 * / 
if (isSystenServer) { 
PemittedCapabilities=args[5] | (int64 t) args[6] << 32; 
effectiveCapabilities=args[7] | (int64 t) args[8] << 30; 
} else { 
pemittedCapabilities= effectiveCapabilities= 0; 


/hx 判断 当前 虚拟 机 是 否 支持 Zygotex / 
证 (!gpum.zygote) { 
dmtrhrowI]legalStategxoepticn( 
"WM instance not started with - Xzygote"); 
retum 一 17 


As 判断 堆 创建 是 否 成 功 ,不 成 功 则 停止 虚拟 机 * / 
if (!dumGcPrezygoteFork()) { 
IOGE (pre fork heap failed"); 
Gummbort () > 
} 
hx 设置 信号 处 理 * / 
setSignalHandler()7 
GumDumpLoaderstats ("zygote") ; 
Axxfork 子 进程 * / 
pid- fork(); 
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if (id=0) { 
/x 根据 传人 的 参数 对 子 进程 进行 一 些 处 理 * / 
int err; 
/rx 于 进程 * / 
# ifdef HAVE ANTROID OS 
Gellocreakzygotechild- 1; 
sx 保证 caps 通 过 UID 变 化 ,除非 处 于 root * / 
if (uid (=0) { 
err= Prctl (ER_SET KEEPCAPS, 1, 0, 0, 0); 
证 (err <0) { 
IOGE ("cannot PR_SET KFFPCAPS: % s", strerror(ermo)); 
mAbort (); 


} 
#endif /x*HAVE ANCROID OS * / 

A* 将 list 数组 中 所 标明 的 组 加 入 到 目前 进程 的 组 设置 中 * / 

er setgroupsIntarray (gids); 

if (err <0) { 
IOGE ("cannot setgroups () : $3", strerror (ermo)); 
mAbort ()7 

}Ax 设 置 资源 限制 * / 

err= setrlimitsFramArray (rlimits); 

if (err <0) { 
IOGE ("cannot setrlimit (): $s", strerror (ermo)); 
mAbort ()7 

} 

/Ax 设置 指定 进程 组 标志 号 * / 

er setgid(gid); 

if (err <0) { 
IOGE ("cannot setgid(% d): $s", gid, strerror (ermo)); 
mAbort ()7 

} 

/Ax 设置 用 户 标 志 号 * / 


err= setuid (uid); 

if (err <0) { 
IOGE ("cannot setuid( dj : $a", uid, strerror (ermo)); 
mpbort ()7 

} 

int current= personality (OxffffFFFF); 


int success= personality( (ADCR_ NO RANDOMIZE | current)); 
证 (sucosss==-1) { 
IOW ("Personality switch failed. current=sd error=% d\n", current, ermo); 
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/x 设置 fimx 功 能 标识 * / 
err= setCapabilities (permittedCapabi lities, effectiveCapabilities); 
if err =0) { 
IOGE ("cannot set capabilities ®11x,%11x): Ss", 
Permittedcapabilities，effectiveCapabilities，strerror (err))7 
Gumabort ()7 
A*# 我 们 的 系统 线程 ID 已 经 改变 ,重新 获取 新 的 * / 
Thread* threadF durlIhreadSelf (); 
thread- > systenlTid= dnGetSysThreadId (); 
/Ax 配置 其 余 的 调试 选项 * / 
enableDabugFeabures (sbugFlags) ; 
Ax 将 信号 量 机 制 设 为 默认 * / 
Axx 子 进程 不 支持 zygctex / 
gpvum.zygote= false; 
xx 检查 虚拟 机 初始 化 是 否 成 功 * / 
if (!dvmInitAfterZygote()) { 
L0G ("error in Post- zygote initializaticon"); 
cmbort ()7 
} 
} else if id>0) { 
/* the parent Process * / 
Ax 父 进程 * / 
¥ 
retum pid; 
} 
函数 执行 流程 如 图 6. 10 所 示 。 
forkAndSecializeCommon() 困 数 与 Dalvik_dalvik_system_Zygote_fork() 函 数 的 流程 
相似 : 在 调用 fork() 之 前 ,检查 当前 进程 是 否 支持 Zygote 功能 并 进行 空 堆栈 的 创建 ,调用 
unsetSignalHandler() 函 数 设置 信号 处 理 机 制 . 通 过 判断 fork() 返 回 的 pid 值 来 确定 是 子 进 
程 还 是 父 进程 。 不 同 之 处 在 于 : 四 在 forkAndSpecializeCommon() 函 数 开 始 时 ,需要 分 析 传 
递 过 来 的 参数 isSystemServer. 判 断 所 需 创建 的 子 进程 是 否 为 system_server, 对 其 参数 进行 
相应 处 理 。@@ 由 于 调用 函数 forkAndSpecializeCommon() 所 产生 的 子 进程 都 不 是 Zygote 
进程 ,因而 ,在 子 进 程 中 需要 调用 unsetSignalHandler() 函 数 重 置 信号 机 制 ,同时 , 子 进程 是 
不 能 再 次 创建 新 进程 的 , 故 把 子 进 程 标志 为 不 支持 Zygote: gDvm. zygote 二 false。@ 在 子 
进程 中 还 要 检查 虚拟 机 初始 化 是 否 成 功 ,由 于 所 创建 的 子 进程 需要 执行 相应 任务 ,因此 必须 
保证 虚拟 机 成 功 初始 化 。 
点 拨 在 Dalvik 虚拟 机 中 ,很 多 方法 均 通过 JNI 机 制 进行 调用 ,在 Java 层 定义 函数 , 具 
体 实现 采用 C/C++ 编写 ,采用 C/C++ 实现 可 以 调用 C/C++ 特有 的 函数 ,更 好 地 与 硬件 、 操 
作 系 统 进行 交互 ,提高 程序 的 性 能 。 有 关 JNI 机 制 见 第 2 卷 第 3 章 。 
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和 


提取 并 存储 传 入 的 参 
数 中 的 进程 描述 信息 


很 据 传 入 的 参数 


tN 否 将 参数 permittedCapabilities 、 
A 为 effectiveCapabilities 的 值 置 为 0 


1 是 


加 密 传递 的 参数 将 其 赋 给 
permittedCapabilities 、 


effectiveCapabilities 两 参数 


是 


堆 创建 是 否 成 功 ? 


设置 信号 处 理 


将 虚拟 机 的 Zygote 调 用 状 
态 统计 信息 写 入 日 志文 件 


1 


调用 fork0) 创 建 进程 ， 
返回 pid 
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抛 出 异常 “虚拟 机 实 
例 末 启动 Zygote” 
返回 -1 


否 __| 输出 失败 信息 
停止 虚拟 机 


根据 参数 对 了 进程 进行 处 理 ， 
调用 unsetSignalHandler() 为 了 
进程 设置 信号 量 机 制 ， 并 将 当 
前 虚拟 机 标记 为 不 支持 Zygote 


. pid 值 为 0? 


否 
1 
Zygote 启 动 后 虚 | 
拟 机 是 否 初始 化 2 返回 pid 的 值 
输出 Zygote 初 始 化 后 发 一 | 
生 错误 并 停止 虚拟 机 


6. 10 forkAndSecializeCommon() 函数 流程 图 
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6.4 Dalvik 虚拟 机 运行 应 用 程序 过 程 


6.4.1 apk 文件 生成 


在 Android 系统 中 运行 的 是 专 有 的 Dex 文件 格式 ,第 3 章 已 经 介绍 了 Dex 文件 的 格 
式 , 因 此 ,在 这 里 简单 介绍 应 用 程序 的 生成 Dex 文件 并 且 打 包 为 apk 文件 的 过 程 。 

Android 应 用 开发 和 Dalvik 虚拟 机 Android 应 用 所 使 用 的 编程 语言 是 Java 语言 ， 
Java SE 一 样 , 编 译 时 使 用 Sun JDK 将 Java 源 程序 编译 成 标准 的 Java 字 节 码 文件 (. class 
文件 ) ,而 后 通过 工具 软件 dx 把 所 有 的 字 节 码 文件 转 成 Dex 文件 (classes. dex)。 最 后 使 用 
Android 打包 工具 (aapt) 将 Dex 文件 .资源 (Resource) 文 件 以 及 AndroidManifest. xml 文件 
(二 进 制 格式 ) 组 合成 一 个 应 用 程序 包 (apk)。 应 用 程序 包 可 以 被 发 布 到 手机 上 运行 ,如 
图 6.11 所 示 。 


Java 源 码 AndroidManifest.xml 
JDK aapt 工 具 


CD Dex 文 件 上 地 A apk Kk { Resouree 文 件 ) 
图 6.11 应 用 程序 打包 过 程 图 


其 中 涉及 的 工具 如 下 。 

dx 工具 : 将 Java 编译 后 的 class 文件 转换 成 Dex 格式 文件 。 

Dex 优化 : Dex 文件 的 结构 是 紧凑 的 ,如 果 要 求 运行 时 的 性 能 有 进一步 提高 ,仍然 需要 
对 Dex 文件 进行 进一步 优化 ,优化 后 以 odex 结尾 。 


6.4.2 Dalvik 虚拟 机 运行 应 用 程序 的 主要 流程 


Dalvik 虚拟 机 运行 过 程 包括 初始 化 运行 环境 ,初始 化 虚拟 机 线程 ,加载 核心 类 和 main 
方法 类 以 及 执行 方法 字 节 码 等 几 个 阶段 ,其 运行 过 程 如 图 6. 12 所 示 ( 注 : 图 中 流程 简要 标 
注 了 所 涉及 模块 部 分 ,不 能 作为 严格 划分 标准 ) 。 

图 6. 12 中 标 出 了 流程 中 的 几 个 阶段 所 涉及 的 Dalvik 虚拟 机 的 相应 功能 模块 。 

应 用 程序 是 以 apk 文件 的 形式 被 虚拟 机 通过 类 加 载 模块 引用 加 载 并 提取 可 执行 代码 
的 。apk 文件 解压 后 得 到 Dex 文件 ,类 加 载 模块 对 Dex 文件 进行 解析 ,将 所 需 的 类 的 各 个 
信息 抓 取出 来 并 将 其 封装 到 一 个 数据 结构 实例 对 象 中 ,以 供 解 释 器 直接 引用 这 个 结构 体 对 
象 的 相关 的 成 员 变 量 ,实现 程序 的 实际 运行 。 

类 加 载 模块 的 工作 主要 分 为 以 下 两 个 阶段 。 

(1) 取得 Dex 原始 文件 并 将 其 还 原 到 内 存 中 并 将 Dex 文件 与 一 个 DexFile 结构 体 对 象 
关联 。 
(2) 对 Dex 文件 中 的 各 个 类 依次 进行 加 载 生成 类 对 象 实例 ,并 将 对 象 指针 交付 给 解释 
器 引用 执行 。 

在 Dalvik 上 执行 的 程序 由 字 节 码 组 成 ,由 解释 器 负责 解释 执行 Dex 字 节 码 。 在 字 节 码 
加 载 已 经 完毕 后 ,Dalvik 虚拟 机 解释 器 被 调用 开始 取 指 解释 字 节 码 。 并 根据 指令 进行 相应 
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的 操作 ,然后 返回 相应 的 结果 。 在 Android 4. 04 版 本 中 ,解释 器 共有 两 种 实现 ,分 别 是 C 语 
言 实现 和 汇编 语言 的 实现 ,也 分 别称 作 移动 型 (Portable) 解 释 器 和 快速 型 (Fast) 解 释 器 。 

为 了 缓解 由 于 解释 器 解释 带 来 的 低 效 , 当 前 通常 采用 两 种 方法 解决 这 个 问题 : 采用 
NDK ,调用 静态 编译 的 方法 提高 速率 ; @ 使 用 JIT, 在 运行 时 编译 字 节 码 并 优化 。 虽 然 这 两 
种 方法 都 能 得 到 不 错 的 效果 ,但 是 JIT 更 具 一 般 性 和 可 移植 性 。JIT 混合 了 两 种 技术 ,解释 
器 解释 时 ,编译 部 分 程序 ,并 在 下 次 直接 执行 该 编译 后 的 源 程序 。JIT 和 解释 器 之 间 有 非常 
紧密 的 联系 。 

本 地 方法 调用 (Java Native Interface,JNI) 作 为 Java 代码 和 本 地 代码 互相 调用 以 及 交 
互 的 桥梁 : Java 程序 中 的 函数 调用 Native 语言 写 的 函数 ,Native 一 般 指 的 是 C/C++ 编 
写 的 函数 ; @Native 程序 中 的 函数 调用 Java 层 的 函数 ,也 就 是 说 在 C/C 十 程序 中 可 以 调用 
Java 函数 。 

反射 机 制 允许 程序 在 运行 时 透 过 Reflection API 取得 任何 一 个 已 知名 称 的 类 的 内 部 信 
息 ,包括 其 描述 符 、 超 类 、 实 现 的 接口 .也 包括 属性 和 方法 等 所 有 信息 ,并 可 于 运行 时 改变 属 
性 内 容 或 调用 内 部 方法 。 类 反射 机 制 在 数据 库 方面 的 应 用 更 是 非常 广泛 。 同 时 ,反射 机 制 
具有 很 好 的 派生 性 ,例如 ,Java 语言 基于 类 反射 技术 还 开发 提供 了 动态 代理 和 元 数据 两 种 
机 制 ,使 程序 逻辑 更 加 简单 ,安全 性 更 高 。 

通过 在 Dalvik 虚拟 机 实际 运行 场景 下 ,使 用 GDB 调试 平台 输出 的 堆栈 信息 ,生成 函数 
调用 图 ,进而 可 以 得 到 各 个 模块 之 间 的 关系 图 。 

点 拨 GDB 是 GNU 的 程序 调试 工具 ,主要 完成 以 下 4 个 功能 。 

(1) 启动 程序 ,指明 可 能 影响 其 行为 的 事件 。 

(2) 使 程序 停 在 断 点 处 。 
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(3) 当 程 序 停止 时 ,检查 所 发 生 的 事情 。 

(4) 改变 程序 的 执行 环境 ,以 便 纠 正 一 个 错误 ,继而 了 解 其 他 信息 。 

使 用 GDB 调试 程序 ,借助 GDBSERVER ,以 达到 调试 Android 虚拟 机 或 手机 中 程序 的 
目的 。 具 体 做 法 为 : 应 用 程序 运行 在 目标 平台 ,在 目标 平台 运行 GDBSERVER ,本 地 使 用 
GDB 来 调试 程序 。 


小 结 


Dalvik 虚拟 机 是 Android 系统 的 重要 组 成 ,Android 系统 的 执行 基础 ,为 应 用 程序 提供 
运行 环境 。 在 Dalvik 虚拟 机 中 通过 解释 器 进行 解析 执行 应 用 程序 。 应 用 程序 虽 是 使 用 
Java 语言 编写 ,但 其 在 进入 Dalvik 虚拟 机 执行 前 ,需要 被 转换 为 Dalvik 专 有 执行 格式 一 一 
Dex 文件 ,通过 类 加 载 加 载 到 虚拟 机 ,在 其 中 以 Dalvik 字 节 码 的 形式 被 解释 器 取 指 执行 ,应 
用 程序 依赖 于 各 个 模块 的 协调 工作 。 通 过 Dalvik 虚拟 机 的 执行 流程 的 简要 分 析 对 整体 的 
执行 流程 以 及 各 个 模块 的 位 置 拥有 更 直观 的 认识 ,有 助 于 对 于 各 个 模块 的 分 析 的 深入 理解 。 
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